


WRjurRKa@l 


Angewandte Induktive 
Statistik und Statistische 
Testverfahren 


va Springer Gabler 


Angewandte Induktive Statistik und Statistische 
Testverfahren 


Thomas Cleff 


Angewandte Induktive 
Statistik und Statistische 
Testverfahren 


Eine computergestützte Einführung mit 
Excel, SPSS und Stata 


2) Springer Gabler 


Thomas Cleff 

Fakultät für Wirtschaft und Recht 
Hochschule Pforzheim 
Pforzheim, Deutschland 


ISBN 978-3-8349-0753-0 ISBN 978-3-8349-6973-6 (eBook) 
https://doi.org/10.1007/978-3-8349-6973-6 


Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillier- 
te bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. 


Springer Gabler 

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 

Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich 
vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere 
für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verar- 
beitung in elektronischen Systemen. 

Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt 
auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- 
und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. 
Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem 
Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag noch die Autoren oder 
die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler 
oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in 
veröffentlichten Karten und Institutionsadressen neutral. 


Verantwortlich im Verlag: Markus Braun 
Springer Gabler ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist 


ein Teil von Springer Nature. 
Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany 





Vorwort 


Das hier vorliegende Lehrbuch Angewandte Induktive Statistik und Statistische Testver- 
fahren: Eine computergestützte Einführung mit Excel, SPSS und Stata möchte den Stu- 
dierenden der Volks- und Betriebswirtschaftslehre sowie Praktikern in Unternehmen die 
Grundlagen, Techniken und Anwendungsmösglichkeiten der Induktiven Statistik und der 
statistischen Testverfahren näher bringen. Die Inhalte reichen von der klassischen Mess- 
fehlertheorie und den Grundlagen der Wahrscheinlichkeitsrechnung, über die Darstellung 
unterschiedlicher Wahrscheinlichkeitsverteilungen, bis zur Berechnung von Konfidenz- 
intervallen. Zudem wird ein erster Einblick in parametrische und nicht-parametrische 
Testverfahren gegeben. Alle Themen werden mit Hilfe von computerbasierten Berech- 
nungen auf betriebswirtschaftliche Beispiele angewendet. Die Themengebiete decken so 
alle wichtigen Aspekte einer Hochschulveranstaltung zur Induktiven Statistik ab bzw. ge- 
hen in Teilen sogar darüber hinaus. 

Bei der Abfassung des Buches war es für mich wichtig, auch demjenigen einen Ein- 
blick in die Denkweise statistischer Verfahren zu ermöglichen, der ansonsten Schwierig- 
keiten mit der formalen oder methodischen Herangehensweise eines traditionellen Statis- 
tikbuches hat. An vielen Stellen habe ich versucht, auf überflüssige Formeln zu verzichten 
oder zunächst eine intuitive Herangehensweise an ein Thema zu wählen, bevor eine For- 
mel abgeleitet bzw. angegeben wird. Es dürfte dennoch jeder verstehen, dass ein Buch 
über die Induktive Statistik und über statistische Testverfahren niemals ohne Formeln aus- 
kommen kann und es auch nicht sollte. Wenn die Alltagssprache ın ihrer Präzision versagt, 
ist und bleibt eine Formel letztlich die präziseste Form der sprachlichen Formulierung 
dessen, was methodisch ausgedrückt werden soll. Zur Vertiefung habe ıch jedem Kapi- 
tel Übungsaufgaben mit Lösungen angefügt, die ein effizientes Selbststudium erleichtern 
sollen. 

Letztlich ermöglicht vor allem die allgemeine Verfügbarkeit von Computerprogram- 
men eine neue didaktische Herangehensweise an die Statistik. Jeder Studierende hat heute 
Zugriff auf Standardprogramme wie Excel oder auf Statistikpakete wıe SPSS oder Stata. 
Dieses Lehrbuch beschränkt sich deshalb nicht nur auf die Darstellung der statistischen 
Verfahren, sondern erweitert den Blick auf deren Anwendung mit Hilfe der Computer- 
programme Excel 2010, SPSS (Version 25) und Stata (Version 13). Hierfür sind auf 
der Homepage des Verlages unter springer.com/9783834907530 — neben anderen Zusatz- 
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materialien — die verwendeten Datensätze zur Verfügung gestellt. Mit ihnen können die 
Beispiel- und Übungsaufgaben durchgerechnet werden. 

Ich möchte an dieser Stelle allen danken, die an der Verwirklichung dieses Buches mit- 
gearbeitet haben. Mein besonderer Dank für die Kritische Durchsicht des Manuskripts und 
für die wertvollen Hinweise gilt Dr. Bettina Müller und Prof. Dr. Kirsten Wüst sowie vie- 
len weiteren ungenannten Helfern. Ebenfalls möchte ich mich beı Claudia Rosenbaum als 
der verantwortlichen Lektorin des SpringerGabler Verlags für ihre Unterstützung bedan- 
ken. Verbleibende Fehler und Unzulänglichkeiten gehen selbstverständlich weiterhin zu 
meinen Lasten. Abschließend wäre dieses Buch niemals ohne die Unterstützung meiner 
Familie möglich gewesen. Ihr gilt mein ganz besonderer Dank. 

Ich hoffe auch in Zukunft auf Anregungen und Verbesserungsvorschläge an meine 
E-Mail-Adresse thomas.cleff@hs-pforzheim.de, denn gemäß einer chinesischen Weisheit 
sind nur mit den Augen der anderen die eigenen Fehler gut zu sehen. 


Pforzheim Thomas Cleff 
im Januar 2019 
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Einführung 


Auch dieses Buch über die Grundlagen der Induktiven Statistik könnte man mit der üb- 
lichen Polemik gegen die Statistik beginnen. Jeder kennt sie, hat sıe vielleicht schon 
einmal selbst verwendet oder zumindest im ersten Band dieses Buches (Cleff 2015, S. 1) 
gelesen: „Ich glaube keiner Statistik, die ich nicht selbst gefälscht habe“, „Mit Statis- 
tik kann man alles beweisen“ oder „Es gibt drei Arten von Lügen: Lügen, verdammte 
Lügen und Statistiken“. Letztlich unterstellen alle diese Aussagen, dass Statistik eine 
besonders hinterhältige Form der Lüge und ein mithin manipulatives Instrumentarium 
darstellt. Dennoch vergeht kein Tag, an dem nicht über irgendwelche Statistiken berichtet 
wird. Mit Spannung werden die Ergebnisse des Politbarometers, des Geschäftsklimainde- 
xes oder die neuesten Konjunkturprognosen von der Öffentlichkeit erwartet. Statistische 
Modelle und Methoden sınd dabei zu einem wichtigen Instrument in der betriebswirt- 
schaftlichen Problemanalyse, der Entscheidungsfindung und der Unternehmensplanung 
geworden. Wieso scheint hier nun die eben noch gescholtene Statistik einen unwidersteh- 
lichen Zauber, eine Magie der Präzision der Zahlen auszustrahlen? Wie kommt es, dass 
der oben beschriebene Superlativ von Lügen - Statistiken — auf einmal zur Grundlage 
der Planung von Privatpersonen und Unternehmen wird? Swoboda (1971, S. 16) glaubt, 
dass vor allem die mangelnde Kenntnis statistischer Methoden und deren Möslichkei- 
ten hierfür verantwortlich ıst. Im Zeitalter von Standardsoftware, indem prinzipiell ein 
Mausklick genügt, um ein statistisches Verfahren berechnen zu lassen, wird dem Laien 
der Schritt zu komplizierten Anwendungen leicht gemacht. Nicht selten werden dabei 
Annahmen verletzt, Sachverhalte bewusst — also manipulativ — oder unbewusst verkürzt 
dargestellt. Zudem werden sorgsam ausgearbeitete Statistiken von Lesern und Zweitver- 
wertern unachtsam oder falsch interpretiert und weitergegeben. Hier liegt der eigentliche 
Grund dafür, dass Statistik einerseits Hilfsmittel sein Kann und andererseits auch als Lü- 
ge wahrgenommen wird: Die bewusst oder unbewusst falsche Anwendung statistischer 
Methoden sowie die bewusst oder unbewusst falsche Interpretation der Ergebnisse die- 
ser Verfahren. „Trugschlüsse und Irrtümer sind [dabei] ansteckend wie Windpocken, und 
wie ansteckende Krankheiten breiten sie sich aus. Wer eine Infektion überstanden hat, ist 
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2 1 Einführung 


danach häufig immun gegen erneuten Befall, und wer einen Trugschluss erst einmal er- 
kannt hat, fällt auf ihn nicht mehr so leicht herein“ (Dubbern & Beck-Bornholdt 2007, 
5.17): 

Damit ist das Lernziel dieses Buches bereits bestens umschrieben. Es soll nicht al- 
leın darum gehen, dem Leser die Methoden der Induktiven Statistik und des statistischen 
Testens möglichst verständlich beizubringen, sondern ihn auch gegen mögliche Fehlinter- 
pretationen und Falschanwendungen zu immunisieren. 

Was kennzeichnet nun aber die Induktive Statistik? Hierzu müssen wir uns zunächst 
darüber verständigen, was überhaupt die Aufgabe von Statistik im Allgemeinen ist und 
wie sich die Induktive Statistik und die Deskriptive Statistik voneinander abgrenzen las- 
sen. Historisch gesehen gehen die Methoden der Statistik weit vor Christi Geburt zurück. 
Schon im sechsten Jahrhundert vor Christi sah die Verfassung des Königs Servius Tullius 
eine periodische Erfassung aller Bürger vor. Auch die biblische Weihnachtsgeschichte 
geht auf eine Volkszählung zurück. Politiker hatten seit jeher das Interesse, mit Hilfe 
von Volkszählungen, die Leistungsfähigkeit der Bevölkerung zu ermitteln und damit ei- 
ne Grundlage für die Steuerlast festzulegen. Bei allen frühzeitlichen Statistiken handelt 
es sich in der Regel um Vollerhebungen in dem Sinne, dass buchstäblich jede Person, 
jedes Tier, jedes Objekt gezählt wurde. Aus Sicht des Staatsapparates erfolgte die Samm- 
lung von Daten mit dem Ziel der Gewinnung von Informationen über den eigenen Staat. 
Noch im heutigen statistischen Jahrbuch finden sıch die Wurzeln dieser Interpretation von 
Statistik als Staatsbeschreibung: Abschnitte über „Geografie und Klima“, „Bevölkerung“, 
„Erwerbstätigkeit“ und „Wahlen“ füllen die ersten Seiten des Statistischen Jahrbuches der 
Bundesrepublik Deutschland (Statistisches Bundesamt 2017). 

Bis zum Beginn des 20. Jahrhunderts stand die Beschäftigung mit entsprechend gro- 
ßen Fallzahlen im Vordergrund des Interesses. Diese Periode stellt den Ausgangspunkt 
der Deskriptiven (beschreibenden) Statistik dar. Die Deskriptive Statistik beinhaltet al- 
le Verfahren, mit denen sich durch die Beschreibung von Daten einer Grundgesamtheit 
(engl.: population) Informationen gewinnen lassen. Zu diesen Methoden bzw. Verfah- 
ren gehören unter anderem die Erstellung von Grafiken, Tabellen und die Berechnung 
von deskriptiven Kennzahlen bzw. Parametern (vgl. hierzu beispielsweise Cleff (2015)). 
Erst viel später entwickelte sich die Induktive Statistik, mit deren Hilfe von Stichpro- 
ben Schlüsse auf die Gesamtpopulation gezogen werden. Das Ziehen von Schlüssen aus 
einer Stichprobe führte letztlich auch zur Etablierung des Begriffes der Schließenden Sta- 
tistik, der — wıe auch der Begriff der Inferenzstatistik — häufig synonym zur Induktiven 
Statistik verwendet wird. Die Entwicklung der Verfahren der Induktiven Statistik wurde 
entscheidend durch die Arbeiten von Jacob Bernoulli (1654-1705), Abraham de Moivre 
(1667-1754), Thomas Bayes (um 1702-1761), Pierre-Simon Laplace (1749-1827), Carl 
Friedrich Gauß (1777-1855), Pafnuti Lwowitsch Tschebyschow' (1821-1894), Francis 
Galton (1822-1911), Ronald A. Fisher (1890-1962) und William Sealy Gosset (1876- 
1937) geprägt. Diesen Erkenntnissen ist es zu verdanken, dass heute nicht jede Person 


! Früher auch als Tschebyscheff, Tschebyschew oder Tschebyschev transkribiert. 
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einer Grundgesamtheit, sondern nur eine Stichprobe (engl.: sample) befragt werden muss. 
Dies ist insbesondere dann von Vorteil, wenn Vollerhebungen zu teuer kämen, zu lange 
dauern würden oder die Erhebung mit einer Zerstörung der Untersuchungselemente ein- 
hergehen würde (z.B. bei bestimmten Formen der Qualitäts- und Materialprüfung wie 
Weinproben). Für den Auswertungsprozess bedeutet dies, dass das zu ermittelnde Wis- 
sen nun eben nicht mehr auf Daten einer Vollerhebung basiert, sondern auf Daten einer 
auf bestimmte Art erhobenen Stichprobe. Der Preis dieser Herangehensweise ist der, dass 
die Aussagen über die Grundgesamtheit mit Unsicherheit belegt sind. Allerdings ist die- 
ser Preis im Rahmen der Induktiven Statistik mit Hilfe von Fehlerwahrscheinlichkeiten 
messbar und bei korrekter Anwendung der Verfahren auch nicht besonders hoch. Berech- 
nungsgrundlage für den statistischen Fehler bildet die klassische Messfehlertheorie, deren 
Grundlagen im folgenden Kap. 2 kurz beschrieben werden. 
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Die klassische Messfehlertheorie 


Die klassische Messfehlertheorie geht beim Messen von der Stabilität eines zu messenden 
Merkmals (Reliabilität einer Messung) und von der Grundannahme aus, dass die Ergeb- 
nisse der Messungen mit den wahren Werten korrespondieren (Validität einer Messung). 
Dabei bestreitet die klassische Messfehlertheorie nicht die Existenz von Fehlern. Vielmehr 
geht sie von der durchaus realitätsnahen Annahme aus, dass Messungen selbst bei größ- 
ter Sorgfalt niemals perfekt sein können und somit zwangsläufig Messfehler auftreten. 
So wird ein Astronom bei Messungen der Distanz zwischen zwei Planeten an fünf ver- 
schiedenen Abenden vermutlich auf fünf (leicht) unterschiedliche Werte kommen. Gründe 
hierfür können Unschärfen durch Lichtspiegelungen o.ä. sein. Auch wird mancher schon 
die Erfahrung gemacht haben, dass er beim wiederholten Ausmessen seiner Wohnung auf 
unterschiedliche Grundflächen gekommen ist. Dies liegt nicht daran, dass unterschiedlich 
geeichte Maßbänder verwendet werden, sondern daran, dass unsystematisch (kleinere) 
Messfehler durch falsches Ablesen, durch unregelmäßig dicke Bodenleisten oder durch 
schiefe Wände auftreten können. Aber dennoch: Führt man die Messungen nur häufig ge- 
nug durch, so wird man feststellen, dass ein bestimmter Wert besonders oft vorkommt und 
die davon abweichenden Werte umso seltener auftreten, je weiter diese von dem häufigsten 
Wert entfernt liegen. Diese unsystematischen Fehler bezeichnet der Statistiker als zufällige 
oder statistische Fehler. Sie treten unvorhergesehen auf, folgen aber dennoch bestimmten 
Gesetzmäßigkeiten — nämlich wie wir später sehen werden, der einer Normalverteilung -, 
welche die statistische Berechnung der Größe des unsystematischen Fehlers ermöglichen. 

Mit großer Sicherheit dürfte es sich bei dem häufigsten Wert um den wahren Wert han- 
deln, es sei denn, es ist uns ein systematischer Fehler unterlaufen. Systematische Fehler 
stellen das eigentliche Problem dar, denn für sie stellt die Induktive Statistik keine Be- 
rechnungsmöglichkeit zur Verfügung und sie sind in ihrer ergebnisverzerrenden Wirkung 
kaum einschätzbar. 

Ein systematischer Fehler kann z.B. dann vorliegen, wenn das Maßband der Woh- 
nungsvermessung nicht beim Wert Null, sondern erst beim Wert Eins beginnt und des- 
halb bei jeder Messung ein Zentimeter zu viel ausgewiesen wird. Nun hätte man durch 
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6 2 Die klassische Messfehlertheorie 


sorgsames Überprüfen des Maßbandes diesen Fehler des Messinstrumentes aufdecken 
können, allerdings zeigt die empirische Erfahrung, dass viele Datenerhebungen in der 
Wirtschafts- und Sozialforschung Gefahr laufen, unbemerkte systematische Fehler zu ent- 
halten, da der gesamte Datenerhebungsprozess ein, von einer Vielzahl exogener Faktoren 
beeinflusster, sozialer Prozess ist. Befragte Personen verhalten sich im Laufe des Befra- 
gungsprozesses nicht passiv, sondern interpretieren die Absichten einer Befragung vor 
dem Hintergrund eigener Zielsetzungen bzw. der gegebenen Situation und entwerfen ak- 
tiv eigene Handlungs- und Reaktionsstrategien. Situation und Handlungsweise unterlie- 
gen dabei einer ständigen Revision durch den Befragten und verhindern dadurch exakte 
Messungen. Erhobene Eigenschaften degenerieren zwangsläufig zu instabilen Merkmals- 
ausprägungen, die in Abhängigkeit der beteiligten Akteure und der Situation variieren. 
Fehler sind und bleiben somit an der Tagesordnung und sind unvermeidliche Konsequenz 
des sozialen Charakters einer sozialwissenschaftlichen Datenerhebung. 

Die Betrachtung der Folgen von systematischen Fehlern zeigt aber eindeutig, dass — 
neben der selbstverständlich wünschenswerten Senkung von unsystematischen Fehlern 
— auf die Kontrolle systematischer Störeffekte ein besonderes Augenmerk gerichtet sein 
sollte. Ziel empirischer Forschung muss deshalb die Verhinderung situationsspezifischer 
systematischer Ergebnisverzerrungen sein. Mögliche Ursachen systematischer Fehler sind 
gleichzeitig auch die Ansatzpunkte für deren aktive Kontrolle. Entsprechend sollte 


e das Auswahlverfahren so angelegt werden, dass die Repräsentativität der Stichprobe 
gewährleistet ist und somit kein Stichprobenfehler (engl.: sampling error) vorliegt (vgl. 
Abschn. 2.1). 

e Zudem sollten die kognitive Kompetenz und die Neutralität der am Forschungspro- 
zess beteiligten Akteure gewährleistet sein und Interviewer- und Befragteneffekte so- 
wie durch den Forscher selbst verursachte Fehler möglichst verhindert werden (vgl. 
Abschn. 2.2). Treten diese dennoch auf, spricht man von Nicht-Stichprobenfehlern 
(engl.: non-sampling error). 


2.1 Quelle für Stichprobenfehler 


Nicht selten bezieht sich das Unbehagen gegenüber der Statistik auf die Tatsache, dass als 
Grundlage nicht alle möglichen Beobachtungen einer Grundgesamtheit, sondern nur eine 
Stichprobe herangezogen wird und letztere - aufgrund ıhrer Unvollständigkeit - „doch per 
se nicht richtig sein kann“. Als Beispiele werden dann gerne Wahlprognosen herangezo- 
gen, bei denen die Wahlforscher wieder einmal nicht richtig gelegen haben. Und in der Tat 
ist die politische Meinungsforschung vor allem durch eine Fehlprognose bekannt gewor- 
den: Als im Jahre 1936 der amtierende US-Präsident Franklin Delano Roosevelt und der 
republikanische Bewerber Alf Landon gegeneinander antraten, sah die Zeitschrift The Li- 
terary Digest den republikanischen Herausforderer mit 57 zu 43 Prozent in Führung. Diese 
Ergebnisse galten als besonders glaubwürdig, da The Literary Digest seit 1916 nicht nur 
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alle Wahlausgänge richtig prognostizieren konnte, sondern 1936 auf Basis von Adressen 
aus Telefonbüchern und Autobesitzerlisten mit insgesamt 10 Mio. Fragebögen, von denen 
insgesamt 2,3 Mio. beantwortet und ausgewertet wurden, die bis dahin größte Befragung 
aller Zeiten durchführte. Eine — selbst aus heutiger Sicht — sehr große Stichprobe. Le- 
diglich ein junger Wissenschaftler namens George Gallup glaubte, mit einer realisierten 
Stichprobe von nur 50.000 Probanden widersprechen zu können. Er berechnete einen Sieg 
für Roosevelt und wie wir heute wissen, war dies richtig: Roosevelt konnte Landon mit 62 
Prozent der Stimmen weit überflügeln. 

Wie konnte dies passieren? Wie konnte Gallup mit einer kleinen Stichprobe besser 
prognostizieren als The Literary Digest mit 2,3 Mio. ausgewerteten Fragebögen? Intui- 
tiv gehen viele davon aus, dass sich große Stichproben zur Prognose oder Schätzung der 
wahren Werte besser eignen als kleine Stichproben. Man greift ja schließlich auf einen 
größeren Teil aller Beobachtungen zurück und müsste sich dem wahren Wert zwangs- 
läufig auch besser annähern. Tatsächlich ist die Größe nicht allein der entscheidende 
Faktor für die Repräsentativität von Stichproben. Hinzu kommt die Tatsache, dass die 
Beobachtungen zufällig gezogen werden. Und genau hierin lag der große Fehler von The 
Literary Digest: Die Wahl der Adressdatei von Telefon- und Automobilbesitzern verur- 
sachte eine höhere Ziehungswahrscheinlichkeit wohlhabender Wählerschichten, denn nur 
diese konnten sich Produkte wie Autos oder Telefone überhaupt leisten. Wohlhabende 
Amerikaner wählen aber tendenziell die Republikaner, weswegen das Auswahlverfahren 
zu einer überdurchschnittlichen Berücksichtigung republikanischer Wählerschaft ın der 
Stichprobe führte. Damit war die Bruttostichprobe - d.h. die Aufstellung all derer, die 
in die Befragung aufgenommen werden sollen, nicht repräsentativ. Außerdem steigt bei 
freiwilligen Befragungen die Teilnahmebereitschaft von Personen, die ihre Unzufrieden- 
heit gegen den Amtsinhaber zum Ausdruck bringen wollen. Der Antwortrücklauf (engl.: 
response) und die dadurch entstehende Nettostichprobe verzerrte sich somit zusätzlich 
zugunsten republikanischer Wählerschichten. 

Zusammenfassend muss also festgehalten werden, dass eine Stichprobe verzerrt (engl.: 
biased) ist, wenn sıe Teile der Grundgesamtheit (engl.: population) falsch repräsentiert. 
Die Größe einer (verzerrten) Stichprobe kann deshalb also niemals als alleinige Begrün- 
dung für die Repräsentativität einer Stichprobe dienen. Die Größe einer Stichprobe kann 
einen Stichprobenfehler niemals kompensieren!! Eine Stichprobe ist vielmehr dann re- 
präsentativ, wenn Strukturgleichheit unterstellt werden kann, wenn „sie ın der Verteilung 
aller untersuchungsrelevanten Merkmale der Grundgesamtheit entspricht, d.h. ein zwar 
verkleinertes aber sonst wirklichkeitsgetreues Abbild der Gesamtheit darstellt“ (Bereko- 
ven, Eckert und Ellenrieder 2009, S. 45). 

In der Praxis haben sıch deshalb verschiedene Auswahlverfahren für Stichproben etab- 
liert, die übrigens auch in Kombination miteinander verwendet werden können. Nicht im- 


! Dies sei hier nochmals besonders betont, da nicht selten folgende Aussage zu hören oder zu lesen 
ist: „Die Stichprobe ist mit 250 Befragten sehr groß. Es kann deshalb von der Repräsentativität der 
Befragung ausgegangen werden“. 


8 2 Die klassische Messfehlertheorie 


mer stellen die Verfahren von Anbeginn eine Strukturgleichheit mit der Grundgesamtheit 
sicher, es lässt sich aber über Verfahren (z.B. durch die unterschiedliche Gewichtung von 
einzelnen Gruppen in der Stichprobe) Strukturgleichheit nachträglich herstellen. Die Aus- 
wahlverfahren lassen sich in bewusste Auswahlverfahren (engl.: nonprobability sampling) 
und Wahrscheinlichkeitsauswahlverfahren unterscheiden (vgl. Abb. 2.1). Bei ersteren liegt 
die Entscheidung über die Aufnahme eines Elementes ın die Stichprobe im Ermessen 
des Auswählenden. Die Auswahlwahrscheinlichkeiten der einzelnen Beobachtungen wer- 
den ım Vorhinein nicht angegeben. Wir werden später sehen, dass genau dies der Grund 
dafür ist, weshalb bestimmte Verfahren der Inferenzstatistik nicht angewendet werden 
dürfen und damit die Generalisierbarkeit der Stichprobenergebnisse nicht möglich ist. 
Dennoch kann es unter bestimmten Umständen sinnvoll sein, bewusste Auswahlverfahren 
zu verwenden, nämlich dann, wenn ein interessierendes Merkmal der Grundgesamtheit 
auf wenige Elemente konzentriert ist oder Elemente in die Stichprobe genommen werden, 
die subjektiv als typische bzw. extreme Vertreter der Grundgesamtheit gelten. Beispiels- 
weise lässt sich die Wirkung einer Arznei gegen Beschwerden bei Schwerelosigkeit nur 
an einer kleinen Gruppe von Astronauten überprüfen. Auch die Lead-User-Analyse be- 
schränkt sich in ihrer Betrachtung auf besondere Kunden, die neue Produkte bereits zu 
einem frühen Zeitpunkt im Produktlebenszyklus erwerben. Zur Gruppe der bewussten 
Auswahlverfahren gehört auch das Willkürliche Auswahlverfahren (engl.: convenience 
sampling; judgmental sampling). Letzteres ist bei bestimmten Forschungsfragen sinnvoll, 
ist aber als generelles Auswahlverfahren ungeeignet. 

Ein erster Schritt, aus der Stichprobe einen Miniaturquerschnitt der Grundgesamtheit 
zu machen, ist die sogenannte Quoten-Stichprobe (engl.: quota sampling), bei der hin- 
sichtlich wichtiger Merkmale (z.B. Geschlecht) die Verhältnisse der Grundgesamtheit 
abgebildet werden. Die Bedeutsamkeit dieser Merkmale für den Forschungsgegenstand 
muss zuvor nachgewiesen werden. Nach Festlegung dieser Quoten — beispielsweise 52 
Prozent Frauen und 48 Prozent Männer - erfolgt die Ziehung wiederum über Willkürliche 
Verfahren. Aufgrund ihrer Subjektivität sollten bewusste Auswahlverfahren nur in begrün- 
deten Fällen Anwendung finden. Besser geeignet sind die Verfahren der Wahrscheinlich- 
keitsauswahl (engl.: random sampling; probability sampling). Bei der einfachen Zufalls- 
auswahl (engl.: simple random sampling) besitzt jedes Element der Grundgesamtheit die 
gleiche Wahrscheinlichkeit, in die Stichprobe zu gelangen. Die in der Grundgesamtheit 
befindlichen und nummerierten Elemente können mit Hilfe von Zufallszahlen ausgewählt 
werden. Eine geschichtete Auswahl (engl.: stratified sampling) liegt vor, wenn die Menge 
der Elemente der Grundgesamtheit — wie bei der Quoten-Stichprobe - anhand bestimmter 
Elementmerkmale in disjunkte Mengen (Schichten) zerlegt ist, aus denen einzelne Zu- 
fallsstichproben gezogen werden. Entsprechen die Anteile der Schichten der Stichprobe 
denen der Grundgesamtheit, spricht man von proportional, sonst von disproportional ge- 
zogenen Stichproben. Bei sogenannten Klumpen-Stichproben (engl.: cluster sampling) 
vollzieht sich die Auswahl nicht anhand einzelner Elemente, sondern bezieht sich auf 
Gruppen von Elementen (Klumpen, z.B. Regionen). Die (serielle) Anwendung mehre- 
rer Verfahren hintereinander wird schließlich als mehrstufige Auswahlverfahren (engl.: 
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Bewusste Auswahl 

Die Entscheidung über die Aufnahme eines Elementes in eine Stichprobe liegt im Ermessen des 
Auswählenden. Auswahlwahrscheinlichkeiten der Elemente können nicht angegeben werden. 
Problem: Auswahl subjektiv; stark verminderte Generalisierbarkeit der Ergebnisse; Interferenz- 
statistik ist nicht anwendbar. 

Eine Quoten-Stichprobe soll hinsichtlich bestimmter Merkmale (Geschlecht etc.) die 
Verhältnisse der Grundgesamtheit abbilden. Die Bedeutsamkeit der Merkmale, die als 
Verteilungsschlüssel Verwendung finden, muss nachgewiesen werden. Nach Festlegung 
dieser Quoten erfolgt die Ziehung über Willkürliche Verfahren (s.u.). Die Quotenkon- 
struktion bei heterogenen Grundgesamtheiten ist kompliziert. 


Stichprobe 


Ein bestimmtes Merkmal der Grundgesamtheit ist im Wesentlichen auf wenige Elemente 
konzentriert. Somit genügt die Auswahl dieser Elemente, um den Großsteil der Varianz 
der Grundgesamtheit zu erklären. Als generelles Auswahlverfahren ungeeignet. 


Wahrscheinlichkeitsauswahl 


Die Entscheidung über die Aufnahme eines Elementes in die Stichprobe obliegt dem Zufalls- 


Willkürliche 


prinzip. Auswahlwahrscheinlichkeiten der Elemente können vor der Stichprobenerhebung 
angegeben werden. Interferenzstatistik ist anwendbar. 


Jedes Element besitzt die gleiche Wahrscheinlichkeit in eine Stichprobe zu gelangen. Die 
in der Grundgesamtheit nummerierten Elemente werden mit Hilfe von generierten 
Zufallszahlen ausgewählt. 
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Die Menge der Elemente der Grundgesamtheit ist anhand bestimmter Merkmale in 
disjunkte Mengen (Schichten) zerlegt, aus denen wiederum Einzelstichproben gezogen 
werden. Entsprechen die Anteile der Schichten der Stichproben denen der Grundge- 
samtheit, spricht man von proportionalen, sonst von disproportionalen geschichteten 
Stichproben. 


Geschichtete 
Auswahl 


Grundgesamtheit wird in (oft geografische) Elementgruppen (Klumpen) zerlegt. Hieraus 
werden Klumpen zufällig ausgewählt und deren Einzelelemente vollständig untersucht. 
Dabei können Klumpeneffekte auftreten, da Unterschiede zwischen den Elementen in 


Auswahl 


einem Klumpen geringer als in einer normalen Zufallsstichprobe sein können. 


Die Zufallsauswahl vollzieht sich durch die serielle Anwendung mehrerer Verfahren der 
Wahrscheinlichkeitsauswahl. 





Mehrstufige 
Auswahl 


Abb. 2.1 Auswahlverfahren in der empirischen Forschung 


sequential sampling) bezeichnet.” Bei allen Verfahren der Wahrscheinlichkeitsauswahl 
obliegt die Entscheidung über die Aufnahme eines Elementes in eine Stichprobe also dem 
Zufallsprinzip. Die Auswahlwahrscheinlichkeit der Elemente kann dabei im Vorhinein 


* Für weitere Informationen über Auswahlverfahren vgl. Malhotra (2010, S. 368-430) und ADM 
(1999). 
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immer angegeben werden, was die Anwendung von Verfahren der Inferenzstatistik und 
die Generalisierbarkeit der Stichprobenergebnisse auf die Grundgesamtheit mit einer ge- 
gebenen Fehlerwahrscheinlichkeit ermöglicht. 


2.2 Quellen für Nicht-Stichprobenfehler 


Der Weg zu einer Stichprobe ohne systematischen Fehler ist steinig und erfordert nicht sel- 
ten ein hohes Maß an empirischer Erfahrung. Am Wegesrand lauern Fehler, die nicht nur 
durch eine falsche Auswahl der Erhebungseinheiten entstehen, sondern auch Fehler, die 
trotz sorgfältiger Auswahlmethoden auftreten. Letztere können zufällig oder systematisch 
sein. Während zufällig auftretende Stichprobenfehler wiederum gleichmäßig (mit einem 
Standardfehler) um den wahren Wert streuen — und damit der wahre Wert im Durchschnitt 
richtig geschätzt werden kann -, verzerrt ein systematischer Nicht-Stichprobenfehler die 
Ergebnisse in eine bestimmte Richtung. Er verursacht Ergebnisbeeinträchtigungen und 
stellt ein erhebliches Problem dar. 

Abb. 2.2 stellt mögliche Quellen von Nicht-Stichprobenfehlern dar, deren Auftreten der 
Forscher durch ein angemessenes Forschungsdesign bzw. durch aufmerksame Kontrolle 
des Forschungsprozesses verhindern sollte: 


1. Vollständiger Antwortausfall-Fehler (engl.: unit-non-response error): Können bei ei- 
ner Befragung bestimmte Bevölkerungsgruppen nicht erreicht werden, weil sie zu 
bestimmten Uhrzeiten nicht zu Hause anzutreffen sind oder sıe die Teilnahme ver- 
weigert haben, wird diese Gruppe in der Stichprobe unterrepräsentiert vorkommen. 

2. Antwortfehler (engl.: response error): Geben Befragte unrichtige Angaben oder wer- 
den richtige Angaben vom Interviewer falsch aufgenommen bzw. falsch analysiert, 
ergeben sich Antwortfehler. Diese Fehler können somit auf Seiten des Befragten, aber 
auch auf Seiten des Interviewers oder des Forschers entstehen. 

e Der Befragte ist aufgrund von Unwissenheit, Müdigkeit, Langeweile, einer falschen 
Erinnerung, missverständlicher Fragestellungen oder anderer Umstände nicht in der 
Lage, eine valide Antwort zu geben (engl.: ınability error). Eine Antwort scheitert 
dabei nicht zwangsläufig an fehlenden kognitiven Fähigkeiten der Probanden, son- 
dern auch am Schwierigkeitsgrad der Frage. Wer kennt noch den Markennamen 
eines vor vier Wochen konsumierten Joghurts? Um dem Interviewer „zu gefallen“ 
oder um Nichtwissen zu vertuschen, werden dann bisweilen auch falsche Antworten 
gegeben. Ähnliches gilt für Fragen, bei denen gewisse Antworten als sozial er- 
wünscht gelten: Auch hierbei werden Antworten nicht wahrheitsgetreu, sondern ge- 
mäß einer vermuteten gesellschaftlichen Akzeptanz gegeben. Dieser Effekt ist umso 
größer, wenn Dritte der Befragung — möglicherweise in der Öffentlichkeit — bei- 
wohnen. Antwortverweigerungen bei einzelnen Fragen (engl.: item non-response) 
bilden eine letzte mögliche Quelle für Ergebnisverzerrungen, wenn sich die feh- 
lenden Antworten systematisch über die Befragten verteilen. Geben beispielsweise 
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Nicht-Stichprobenfehler 
Antwort-Fehler Unit-Non-Response-Fehler 


m Generelle oder partielle m Persönlichkeitsmerkmale des m Falsche Definition der Grundgesamtheit 
Antwortverweigerung Interviewers m Ungeeignetes Auswahlverfahren 

m Falsche Antworten m Unkorrekte Fragestellung m Fehler bei der Auswahl von 

m Unfähigkeit zur Antwort m Kodierungsfehler Proximitätsmaßen 

m Meinungslosigkeit m Beeinflussung (Suggestion) m Verwendung falscher Skalen 

m Missverständnis m Fälschungen m Fehler in der Datenanalyse 

m (Un-)bewusste m Unverständliche/ 
Falschangaben uneindeutige Fragen 





m Motivationstechniken m Interviewerschulung m Ethikgrundsätze 

m Sensibilisierung für m Interviewerauswahl m Methodenkenntnis 
Untersuchungsthema m Controlling der Interviewer m Sachkenntnis 

m Abbau von Ängsten durch 
Anonymitätszusage 

m Zielgruppenorientierte 
Fragebogengestaltung 

m Anbieten von Hilfestellung 


Abb. 2.2 Nicht-Stichprobenfehler (In Anlehnung an Malhotra (2010, S. 117). Eigene Darstellung) 


niedrige Einkommensgruppen die Höhe der Lohnzahlungen nicht an, ergeben sich 
zu hohe Durchschnittseinkommen. 

e Aber auch der Interviewer ist Quelle von Stichprobenverzerrungen: Die nicht exakte 
Verwendung des vorgegebenen Fragetextes (engl.: questioning error), die (irrtümli- 
che/nachlässige/selektive) Übernahme falscher Werte in den Antwortbogen (engl.: 
recoding error) oder Persönlichkeitsmerkmale (Aussehen/Ausstrahlung/Benehmen) 
des Interviewers können Befragungsergebnisse verfälschen. „Ich mag keine Män- 
ner mit Schnurrbart‘“ würde ein Interviewer mit Schnurrbart wohl seltener zu hören 
bekommen, als ein Interviewer ohne Schnurrbart. Versuche von Interviewern, Pro- 
banden aktiv zu beeinflussen oder gar bestimmte Aussagen zu suggerieren, wirken 
verzerrend. Dabei ist es eine Gratwanderung zwischen Hilfestellung auf der einen 
und Suggestion auf der anderen Seite. Die Gefahr von Fälschungen durch Selbst- 
ausfüllen von Fragebögen durch den Interviewer ist insbesondere dann hoch, wenn 
im Rahmen einer Quotenstichprobe noch Probanden mit seltener Merkmalsstruktur 
gesucht und befragt werden müssen. 

e Schließlich beeinflusst der Forscher durch die Art der Fragenformulierung und die 
Auswahl der verwendeten Skalen (Antwortmöglichkeiten) selbst das Antwortver- 
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halten von Befragten. Hierzu zählten beispielsweise der unnötige Gebrauch von 
Fremdwörtern, die missverständliche Formulierung von Fragen sowie das Nahele- 
gen einer bestimmten Antwort. Selbst die Reihenfolge der Fragen kann Verzerrun- 
gen hervorrufen, wenn vorangehende Fragestellungen einen Einfluss auf die inhalt- 
liche Bewertung der Befragten bei nachfolgenden Fragen haben. Zudem können 
Fehlerquellen wie eine falsche Definition der Grundgesamtheit, eine ungeeignete 
Auswahlmethode (wie zum Beispiel die Auswahl von Telefonlisten durch The Li- 
terary Digest) und Fehlern bei der Auswahl von Proxy-Skalen? hinzukommen. 


Es wırd mehr als deutlich, wie vielen potenziellen Fehlerquellen empirische Erhebun- 
gen unterliegen können. Der Forscher muss in verantwortlicher Weise diese Fehlerquellen 
kontrollieren und in seiner Ergebnisinterpretation berücksichtigen. Es bleibt schließlich 
noch die Frage zu klären, wie groß eine Stichprobe eigentlich sein sollte? Diese Frage 
wollen wir ım weiteren Verlauf des Buches noch mehrmals ansprechen, aber hier be- 
reits festhalten, dass die Zuverlässigkeit von Schätzwerten einer Zufallsstichprobe mit 
zunehmender Stichprobengröße steigt. An dieser Stelle wollen wir uns zunächst mit ei- 
nem anschaulichen Beispiel begnügen: Nachdem eine Suppe ausreichend gerührt wurde, 
damit die Gewürze „repräsentativ“ im Kochtopf verteilt sind, kommen Sie zum Abschme- 
cken der Suppe. Das Abschmecken ist nichts anderes als das Ziehen einer Stichprobe, 
denn wir hoffen, dass das Probieren der Suppe uns in die Lage versetzt, eine Aussage über 
den Geschmack der gesamten Suppe zu machen. Hierfür können Sie einen Zahnstocher, 
einen Suppenlöffel oder eine große Suppenkelle verwenden. Man wird kaum einen Ein- 
druck über den Geschmack erlangen, wenn der Zahnstocher in die Suppe getaucht und 
hiernach abgeschmeckt wird. Eine etwas größere und sicherlich bessere Stichprobe wä- 
re der Suppenlöffel. Die Verwendung einer großen Suppenkelle wirkt demgegenüber als 
unnötig große Stichprobe. Bevor wir die ausreichende Größe des Suppenlöffels ın Ana- 
logie zur Stichprobengröße bestimmen, werden wir uns zuvor mit den Grundlagen der 
Wahrscheinlichkeitsrechnung befassen. 
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> Proxi-Skalen werden verwendet, wenn eine tatsächliche Handlung nicht oder nur indirekt beob- 
achtet werden kann (z.B. bei einer künftigen Kaufentscheidung) und deshalb Hilfskonstrukte (z.B. 
Präferenzen für ein gewisses Produkt) gewählt werden müssen. 





Wahrscheinlichkeitsrechnung 


Fasst man die Überlegungen zu Stichproben zusammen, so wird man auf eine komplette 
Erhebung der Grundgesamtheit immer dann verzichten, wenn eine Vollerhebung ... 


e ... zu teuer ist, 


. zu viel Zeit in Anspruch nehmen würde, 


... die Untersuchungselemente durch die Erhebung zerstört würden (z.B. Materialprü- 
fung, Weinprobe, etc.) oder 

e ... organisatorisch nicht durchführbar wäre (z.B., weil nicht alle Untersuchungsein- 
heiten erreicht werden können). 


Sicher gibt es noch eine Vielzahl weiterer Gründe auf eine Vollerhebung zu verzichten, 
sodass die obige Liste unvollständig sein dürfte. Auf Basis der Ergebnisse der Stichpro- 
be wird dann mit Hilfe der Wahrscheinlichkeitstheorie auf die Zusammenhänge in der 
Grundgesamtheit geschlossen. In der Alltagssprache wird der Begriff wahrscheinlich im- 
mer dann verwendet, wenn man sich über einen Sachverhalt nicht vollständig sicher ist: 
„Wahrscheinlich wird es morgen regnen“, „wahrscheinlich bestehe ich die Statistikklau- 
sur“ oder „wahrscheinlich sehen wir uns morgen“ sind alles Aussagen, bei denen wir uns 
nicht sicher sein können, dass das genannte Ereignis auch wirklich eintritt. Weniger noch: 
Diese Aussagen spiegeln nicht einmal das mögliche Ausmaß der „Eintrittswahrscheinlich- 
keit“ wider. Konkreter sind da schon die Aussagen „die Wahrscheinlichkeit im Lotto 6 aus 
49 sechs Richtige zu haben, ist sehr gering‘ oder „die Wahrscheinlichkeit, dass ein Neu- 
geborenes mehr als fünf Kilogramm wiegt, ist sehr gering“. In diesen Fällen wissen wir 
zumindest die ungefähre Ausprägung der Wahrscheinlichkeit, nämlich „sehr gering“. Die 
konkretesten Formen, das Ausmaß der Eintrittswahrscheinlichkeit eines Ereignisses an- 
zugeben, sind sicherlich Aussagen wie „die Wahrscheinlichkeit im Lotto sechs Richtige 
zu haben beträgt 1 zu 13.983.816“ oder „die Wahrscheinlichkeit, dass ein Neugebore- 
nes mehr als fünf Kilogramm wiegt, liegt bei 0,3 Prozent“ (Schwarze 2009, S. 12). Es 
wird also immer dann konkret, wenn man die Wahrscheinlichkeiten für das Eintreten von 
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Ereignissen in bestimmten Zahlen angeben kann. Diese Zahlen bewegen sich zwischen 
Null für ein unmögliches Ereignis und Eins für ein sicheres Ereignis. Wıe aber lassen 
sich diese Zahlen als Ausdruck der Wahrscheinlichkeit ermitteln? Bevor wir uns dieser 
Frage zuwenden, müssen zunächst einige Begriffe und Grundlagen der Wahrscheinlich- 
keitsrechnung eingeführt werden. 


3.1 Begriffe der Wahrscheinlichkeitsrechnung 


Beim Ziehen von Lottokugeln oder beim Werfen einer Münze handelt es sich um Vor- 
gänge, bei denen mehrere — zumindest aber zwei — unterschiedliche Ereignisse eintreten 
können. Diese Vorgänge heißen Zufallsexperimente (engl.: experiments), jeder mögli- 
che Ausgang eines Zufallsexperimentes Ereignis oder Ergebnis (engl.: event; outcome). 
Welches der Ereignisse letztlich eintritt, ist im Vorhinein nicht bestimmbar. Beim Wer- 
fen eines Würfels — man bezeichnet dies auch als Würfelexperiment - stellen ungerade 
Zahl oder gerade Zahl mögliche Ereignisse dar. Diese ließen sich weiter in sogenannte 
Elementarereignisse zerlegen, nämlich für die ungeraden Zahlen in eins, drei und fünf 
oder für die geraden Zahlen in zwei, vier oder sechs. Nicht mehr zerlegbare und sich 
ausschließende Möglichkeiten für den Ausgang eines Zufallsexperimentes heißen Ele- 
mentarereignisse (engl.: elementary events). Alle Elementarereignisse — also die Menge 
NR = {w1,@2,@3,...@m + — bilden den Ergebnis- oder Ereignisraum (engl.: sample space). 
Der Ereignisraum beim Würfelexperiment setzt sich somit aus den Elementarereignissen 
2 = {1,2,3,4,5,6} zusammen (vgl. Abb. 3.1). Natürlich können Einzelereignisse auch 
wieder zu zusammengesetzten Ereignissen (engl.: union of events) vereinigt werden. Im 
Würfelexperiment ließe sich beispielsweise das Ereignis „Augenzahl unter vier“ aus den 
Elementarereignissen {1,2,3} zusammensetzen. Logisch lässt sich die Vereinigung von k 
Ereignissen als Inklusiv-ODER-Verknüpfung darstellen, da alle Ereignisse zusammenge- 


führt werden, die entweder zum einen oder zum anderen spezifizierten Ereignis gehören: ' 


k 
(a-avau..un= Ua) (3.1) 
i=1 
Interessiert das gleichzeitige Eintreten zweier Ereignisse, spricht man vom Durchschnitt 
von Ereignissen (engl.: intersection of events): 


k 
a-anan..na=Na) (3.2) 


i=] 


! Die Aussage „Am Montag oder Dienstag gehe ich zur Bank“ hat sprachlich zwei mögliche Inter- 
pretationen: Exklusiv-ODER: Der Kunde geht nur an einem Tag zur Bank, nämlich entweder am 
Montag oder am Dienstag. Nur eines der Ereignisse ist wahr. (2) Inklusiv-ODER erlaubt zudem 
beide Möglichkeiten gleichzeitig: Ein Besuch der Bank ist möglich am Montag, Dienstag und an 
beiden Tagen. 
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Abb. 3.1 Ereignisraum und 
zusammengesetzte Ereignisse 





le 


©2 = Ereignisraum Zusammengesetzte Ereignisse 


Es handelt sich um eine logische UND-Verknüpfung, denn der Durchschnitt AN B bil- 
det sich, wenn mit dem Eintritt von Ereignis A automatisch auch das Ereignis B eintritt 
(vgl. Abb. 3.2). Im Würfelexperiment soll beispielsweise die Menge beschrieben wer- 
den, deren Augenzahl gerade und gleichzeitig kleiner als fünf ist. Die Menge der geraden 
Zahlen wird durch A = {2,4,6} und die Menge der Zahlen kleiner als fünf durch die 
Menge B = {1,2, 3,4} beschrieben. Lediglich die Zahlen zwei und vier erfüllen die Be- 
dingung beider Mengen ANB = {2,4}. Tritt ein Ergebnis B immer dann nicht ein, wenn 
das Ereignis A eintritt, schließen sich A und B aus (engl.: mutually exclusive events). 
Es gilt dann AM B = {}. Die Vereinigungsmenge entspricht dabei nicht zwangsläu- 
fig dem gesamten Ereignisraum $2, denn wie das Würfelexperiment zeigt, schließen sich 
die Augenzahlen drei und vier aus, bilden aber nicht gemeinsam den Ereignisraum eines 
Würfelexperiments ab. Der Sonderfall sich ausschließender Ereignisse sind sogenannte 
komplementäre Ereignisse (engl.: complement), bei der ein Ereignis B automatisch nicht 
eintritt, wenn das Ereignis A eintritt und beide zusammen den gesamten Ereignisraum 92 
bilden, wenn also gilt AUB = Rund ANB = {} (vgl. Abb. 3.2). Im Würfelexperiment 
schließen sich beispielsweise die Ereignisse A „gerade Augenzahl“ und B „ungerade 
Augenzahl“ aus (AN B = {}) und die Vereinigungsmenge entspricht dem gesamten Er- 
eignisraum: AU B = {2,4,6} U {1,3,5} = {1,2,3,4,5,64 =. 

Zufallsexperimente lassen sich in einstufige und mehrstufige Zufallsexperimente unter- 
scheiden. Während bei einstufigen Zufallsexperimenten lediglich ein Experiment durch- 
geführt wird, werden bei mehrstufigen Zufallsexperimenten zwei oder mehr Experimente 
nacheinander durchgeführt. Bei einem dreifachen seriellen Münzwurf spricht man von 
einem dreistufigen Zufallsexperiment, das anschaulich mit Hilfe eines Ereignisbaumes 
dargestellt werden kann. Jeder Pfad von der Wurzel über die einzelnen Verzweigungen 
bis hin in die Blätter am rechten Ende des in Abb. 3.3 abgebildeten Ereignisbaumes stellt 
eine der möglichen Ereignisfolgen dar. 
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Durchschnitt von Ereignissen Durchschnitt ANnB=1{} Komplementärereignis 





Abb. 3.2 Durchschnitt von Ereignissen und komplementäre Ereignisse 
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Abb. 3.3 Ereignisbaum für einen dreifachen Münzwurf 


3.2 Definitionen des Wahrscheinlichkeitsbegriffes 


Bisher war nur von Ereignissen und Kombinationen von Ereignissen die Rede. Dem Ziel, 
den Begriff der Wahrscheinlichkeit konkreter zu definieren, sind wir dadurch nur unbe- 
merkt näher gekommen. Betrachten wir deshalb nun einmal folgende Aussagen: 


l. Die Wahrscheinlichkeit im Lotto sechs Richtige zu haben, beträgt I zu 13.983.816. 

2. Die Wahrscheinlichkeit, dass ein Neugeborenes mehr als fünf Kilogramm wiegt, liegt 
bei 0,3 Prozent (Schwarze 2009, S. 12). 

3. Die Wahrscheinlichkeit, dass es außerhalb der Erde andere intelligente Lebensformen 
gibt, liegt bei 50 Prozent. 


Semantisch unterscheiden sich alle drei Aussagen nicht voneinander, denn in allen Fäl- 
len ıst von der Wahrscheinlichkeit die Rede. Dennoch stecken hinter allen drei Beispielen 
unterschiedliche Erklärungsmodelle über das Vorgehen bei der Quantifizierung der je- 
weils angegebenen Wahrscheinlichkeit. Theoriengeschichtlich sind sie unterschiedlichen 
Konzepten zuzuordnen: Im ersten Beispiel wird die Wahrscheinlichkeit mit Hilfe des 
klassischen Wahrscheinlichkeitsbegriffs bestimmt, im zweiten Beispiel mit Hilfe des sta- 
tistischen Wahrscheinlichkeitsbegriffs und im dritten Beispiel mit Hilfe des subjektiven 
Wahrscheinlichkeitsbegriffs. 

Der klassısche Wahrscheinlichkeitsbegriff unterstellt, dass jedes Elementarereignis 
gleich wahrscheinlich und die Wahrscheinlichkeit a priori bestimmbar ist. Als erster be- 
gründete der Mathematiker Jacob Bernoulli (1654-1705) diese Annahme mit dem Prinzip 
vom unzureichenden Grund. Dieses besagt, dass das Eintreten von unterschiedlichen 
Ereignissen als gleich wahrscheinlich angenommen werden kann, wenn keine weiteren 
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Informationen vorliegen (Indifferenzprinzip). Die Zahlenkombination (1,2, 3,4,5,6) ist 
beim Lotto demnach genauso wahrscheinlich, wie jede beliebige andere Zahlenkombi- 
nation. Da insgesamt 13.983.816 unterschiedliche Zahlenkombinationen existieren, lässt 
sich die Wahrscheinlichkeit für eine gegebene Zahlenkombination mit 1 zu 13.983.816 
angeben. Laplace (1749-1827) leitete aus dieser Idee die klassische Definition der Wahr- 
scheinlichkeit ab, indem er die Wahrscheinlichkeit als Quotient aus der Anzahl der für 
das Ereignis günstigen Fälle und der Anzahl aller möglichen Fälle definierte. Diese 
Wahrscheinlichkeitsdefinition wird deshalb auch Laplace-Wahrscheinlichkeit genannt: 


Anzahl der für das Eintreten von A günstigen Fälle Anzahl (A) 


P(A) = ee 
“ Anzahl aller möglichen Fälle Anzahl (2) 


(3.3) 
Die Wahrscheinlichkeit eine gerade Zahl im Würfelexperiment zu würfeln, wäre demnach 
P(gerade Augenzahl) = 3/6 = 1/2, da die Anzahl aller möglichen Fälle sechs und die 
entsprechende Anzahl der günstigen (geraden) Fälle drei entspricht. Befinden sich in einer 
Lostrommel 100 Lose mit 20 Gewinnen, so ist die Gewinnwahrscheinlichkeit 


P (Gewinn) = 20/100 = 0,2 = 20%. (3.4) 


Bei den genannten Beispielen gehen wir, wie gesagt, davon aus, dass alle Ereignisse gleich 
wahrscheinlich sind, also die gleiche Chance haben, gezogen zu werden. Jedes Elemen- 
tarereignis besitzt somit die gleiche (Laplace-)Wahrscheinlichkeit P(j) = 1/N.” Das 
kann und muss in der Praxis nicht immer der Fall sein: Besteigt ein Passagier beispiels- 
weise ein Flugzeug und würde mit obiger Formel die Wahrscheinlichkeit eines Absturzes 
berechnen, erhält er für die Anzahl aller möglichen Fälle 2 = {Absturz; kein Absturz} 
den Wert zwei und für die Anzahl des für ihn negativen Ereignisses Absturz den Wert 
eins. Damit ergibt sich eine Absturzwahrscheinlichkeit von P(Absturz) = 1/2 = 50%. 
Kein Passagier würde bei dieser Wahrscheinlichkeit — auf zwei Flüge käme ein Absturz 
— ein Flugzeug auch nur betreten wollen. Grund für diese Fehlbestimmung der Absturz- 
wahrscheinlichkeit ıst die Tatsache, dass die Ereignisse Absturz und kein Absturz in der 
Realität keine gleichmöglichen bzw. gleich wahrscheinlichen Fälle darstellen. Hier zeigt 
sich der Fallstrick des klassischen Wahrscheinlichkeitsbegriffs in seiner praktischen An- 
wendung, wenn die zugrunde liegende Annahme der Laplace-Wahrscheinlichkeit nicht 
vorliegt: Wahrscheinlichkeiten lassen sich mit Hilfe der Laplace-Wahrscheinlichkeit nur 
berechnen, wenn wir davon ausgehen, dass die Ereignisse alle mit derselben Wahrschein- 
lichkeit eintreten. 

Auch für das Beispiel des Geburtsgewichtes von Neugeborenen lassen sich mit Hil- 
fe der Laplace-Wahrscheinlichkeit a priori keine Wahrscheinlichkeiten bestimmen. Nicht 
jedes Geburtsgewicht ist gleich wahrscheinlich. Die Abschätzung der Wahrscheinlichkeit 
erfolgt in diesem Fall a posteriori durch Beobachtung der relativen Häufigkeit derartiger 


* Mit Hilfe der Kombinatorik lässt sich die Anzahl aller möglichen Elementarereignisse (R) auch 
für umfangreichere Fallzahlen bestimmen (vgl. Abschn. 3.3.2). 


18 3 Wahrscheinlichkeitsrechnung 


Geburtsgewichte in der Vergangenheit. Da in der Vergangenheit der Anteil von Neugebo- 
renen mit mehr als fünf Kilogramm bei 0,3 Prozent lag, wird davon ausgegangen, dass die 
Wahrscheinlichkeit für dieses Ereignis ebenfalls bei 0,3 Prozent liegt. 

Dieses Vorgehen entspricht dem statistischen Wahrscheinlichkeitsbegriff, der im We- 
sentlichen von der axiomatischen Wahrscheinlichkeitsdefinition von Richard von Mises 
(1883-1953) geprägt worden ist. Jedem Ereignis aus dem Ereignisraum wird eine reelle 
Zahl zugeordnet, welche die Chance, dass genau dieses Ereignis eintritt, zum Ausdruck 
bringt. Dieser funktionale Zusammenhang ist die Wahrscheinlichkeit (engl.: probability) 
und besitzt folgende Eigenschaften (Axiome von Kolmogoroff): 


e Die Wahrscheinlichkeit ist eine nicht-negative Zahl: P(A) > 0. 

e Schließen sich zwei Wahrscheinlichkeiten aus, dann ergibt sich für das zusammenge- 
setzte Ereignis die Summe der Wahrscheinlichkeiten: P(AU B) = P(A) + P(B) für 
ANB=!HL!}. 

e Die Wahrscheinlichkeit für das sichere Ereignis ist gleich Eins (= 100 %). 


Das bedeutet letztlich, dass sich Wahrscheinlichkeiten nicht willkürlich setzen lassen, son- 
dern ein Maß für die Chance des Eintretens von Ereignissen darstellen. Ist ein Ereignis 
unmöglich, so hat es eine Wahrscheinlichkeit von Null (P(A) = 0) und wenn ein Ereig- 
nis mit Sicherheit eintritt, hat es eine Wahrscheinlichkeit von Eins (P(A) = 1). 

Wenn nun aber nicht alle Ereignisse die gleiche Eintrittswahrscheinlichkeit haben, wie 
lassen sich dann jedem Ereignis Wahrscheinlichkeitswerte zuordnen? Der Wahrschein- 
lichkeitstheoretiker Richard von Mises (1883-1953) führte den Wahrscheinlichkeitsbe- 
griff deshalb auf die relative Häufigkeit bestimmter Ereignisse zurück. Er geht davon 
aus, dass sich das Auftreten eines bestimmten Ereignisses zufällig ergibt. Da zur Fest- 
stellung der „wahren“ Wahrscheinlichkeit eines Ereignisses das damit verbundene Zu- 
fallsexperiment nicht unendlich oft wiederholt werden kann, dient die relative Häufigkeit 
des Auftretens des Ereignisses als Annäherung (Schätzung) für den Wert der sogenannten 
empirischen Wahrscheinlichkeit. Nehmen wir als Beispiel das Werfen einer Münze mit 
den möglichen Ereignissen Wappen oder Zahl und ermitteln die relative Häufigkeit für 
das Ereignis Zahl bei hundert Münzwürfen. Die Entwicklung der relativen Häufigkeit ist 
in Abb. 3.4 dargestellt. 

In dieser Versuchsreihe beträgt die relative Häufigkeit für die Ausprägung „Zahl“ nach 
vier Würfen F(Zahl) = 3/4 = 0,75, nach 20 Würfen F(Zahl) = 13/20 = 0,65, nach 
70 Würfen F(Zahl) = 28/70 = 0,54 und schließlich nach 100 Würfen F(Zahl) = 
51/100 = 0,51. Je größer die Anzahl der durchgeführten Experimente ist, umso mehr 
nähert sich der Wert der relativen Häufigkeit dem der „wahren“ Wahrscheinlichkeit an. Die 
Wahrscheinlichkeit für das Auftreten eines Ereignisses A entspricht somit dem Grenzwert 


> Jedoch bedeutet P(A) = 1 nicht unbedingt, dass es sich um ein sicheres Ereignis handelt, sondern 
lediglich, dass die relative Häufigkeit dieses Ereignisses bei einer großen Anzahl von n Versuchen 
100 Prozent ist. Analog gilt für P(A) = 0, dass die relative Häufigkeit dieses Ereignisses bei einer 
großen Anzahl von n Versuchen 0 Prozent ist. 
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Abb. 3.4 Relative Häufigkeit bei einem Münzwurf 


der relativen Häufigkeit bei unendlicher Durchführung des Zufallsexperimentes: 


n 
| .=1 für Zahl 
P(A) = lim (/,(A)) = lim |). |, wobei gilt: 4° ee; 
ne NZ x; =0 für Wappen 


Der Zusammenhang zwischen relativer Häufigkeit und der Wahrscheinlichkeit bei einer 
gegen unendlich laufenden Anzahl der Experimente, veranlasste Jacob Bernoulli dazu, 
dies als Gesetz der großen Zahlen zu bezeichnen. Ein empirischer Beweis dieses Zusam- 
menhanges ist zwar nicht möglich, da niemand ein Experiment unendlich oft durchführen 
kann. Auch sind bisher alle mathematisch-theoretischen Beweise hierzu gescheitert (Schi- 
ra 2012, S. 222ff.). Allerdings bildet der Ansatz eine gute Grundlage für die Induktive 
Statistik, bei der sich Wahrscheinlichkeiten zwar nicht exakt, bei hinreichend großen 
Stichproben allerdings gut abschätzen lassen. 

Der klassische und der statistische Wahrscheinlichkeitsbegriff lassen sich dem objek- 
tiven Wahrscheinlichkeitsansatz zuordnen. Beide Konzepte erweisen sich ın der empiri- 
schen Praxis als sehr nützlich, haben allerdings Grenzen, wenn die Wahrscheinlichkeit 
eines Ereignisses ohne sein tatsächliches Eintreten bestimmt werden soll oder wenn ein 
Experiment nicht wıederholbar ist. Zur Bestimmung der Wahrscheinlichkeit, dass es ın- 
telligente Lebensformen außerhalb der Erde gibt, liegen weder Annahmen über die po- 
tenzielle Häufigkeit dieses Ereignisses vor, noch lässt sich die Wahrscheinlichkeit mit 
Hilfe von wiederholbaren Experimenten bestimmen. In diesen Fällen kommt der sub- 
jektive Wahrscheinlichkeitsbegriff zur Anwendung. Dieser von Savage (1917-1971) und 
de Finetti (1906-1985) geprägte Ansatz individualisiert die Betrachtungsweise von Wahr- 
scheinlichkeit, indem Wahrscheinlichkeit als Maß für das Vertrauen, das eine „vernünftig 
denkende Person“ dem Eintreten eines bestimmten Ereignisses entgegenbringt, definiert 
wird (vgl. Savage 1954 und de Finetti 2008). Die Person wird ihre Einschätzung dabei auf 
ihre Intuition, ihr Experten- und ihr Erfahrungswissen zum jeweiligen Thema gründen. 
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Ansätze der Wahrscheinlichkeitstheorie 
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Abb. 3.5 Ansätze der Wahrscheinlichkeitstheorie 


Wahrscheinlichkeit ist somit allein Ausdruck einer individuellen Einschätzung und lässt 
sich im Englischen mit dem Satz „Probability is degree of belief!“ treffend charakterisie- 
ren. So würde ein „vernünftig denkender Mensch“ die Wahrscheinlichkeit der Zahl sechs 
bei einem fairen Würfel auf 1/6 schätzen. Dies entspricht der Erkenntnis des klassischen 
Wahrscheinlichkeitsbegriffs. Meint die gleiche Person nun aber festzustellen, dass es sich 
um einen unfairen Würfel handelt, wird sie ihre Einschätzung über die Wahrscheinlich- 
keit individuell verändern. Wettquoten bilden dabeı die individuelle Wahrscheinlichkeit 
eines Ereignisses ab: Ist eine Person gerade noch dazu bereit, bei dem nächsten Wurf 
des Würfels auf eine Sechs zu setzen, wenn er bei Erfolg für einen eingesetzten Euro 
zwei Euro Gewinn erhält, so beträgt die subjektive Wahrscheinlichkeit für eine Sechs: 
Pie. FD) el ea 

Abb. 3.5 fasst alle drei beschriebenen Wahrscheinlichkeitsansätze nochmals schema- 
tisch zusammen. Im Folgenden wollen wir uns nun den grundlegenden Regeln der Wahr- 
scheinlichkeitsrechnung wıdmen. Diese sind unabhängig vom gewählten wahrscheinlich- 
keitstheoretischen Ansatz, gelten somit für die klassische, die statistische und die sub- 
jektive Wahrscheinlichkeitstheorie gleichermaßen. Für die Rechenregeln der Wahrschein- 
lichkeit ist es also unerheblich, wıe man an die Werte für einzelne Wahrscheinlichkeiten 
gelangt. Vielmehr geht es darum, wie mit den Werten für Wahrscheinlichkeiten gerechnet 
werden kann. 
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3.3 Grundlagen der Wahrscheinlichkeitsrechnung 


3.3.1 Der Wahrscheinlichkeitsbaum 


Eine erste Möglichkeit, Wahrscheinlichkeiten darzustellen und mit ihnen zu rechnen sind 
sogenannte Wahrscheinlichkeitsbäume. Sie leiten sich aus der Idee der Ereignisbäume ab 
und sind eine grafische Darstellung der Wahrscheinlichkeiten aller möglichen Ereignis- 
kombinationen. An die Äste werden jeweils die Wahrscheinlichkeiten abgetragen, die mit 
der jeweiligen Verzweigung verbunden sind. Die Summe der Wahrscheinlichkeiten an je- 
der Verzweigung muss immer Eins ergeben, denn nur dann sind alle möglichen Ereignisse 
an der jeweiligen Verzweigung auch berücksichtigt. In Abb. 3.6 ist der Wahrscheinlich- 
keitsbaum für das Zufallsexperiment, dass eine Münze drei Mal hintereinander geworfen 
wird, exemplarisch dargestellt. Die Wahrscheinlichkeit für eine bestimmte Ereignisfolge 
lässt sich durch Multiplikation der auf dem Pfad liegenden Wahrscheinlichkeiten ermitteln 
(Pfadmultiplikationsregel). Die Wahrscheinlichkeit für die Ereignisreihenfolge 1. Wurf 
Wappen, 2. Wurf Zahl, 3. Wurf Zahl ergibt sich somit als: 


u u 


Auch lassen sich Wahrscheinlichkeiten für Ereignisfolgen bestimmen, die nicht in den 
Blättern des Wahrscheinlichkeitsbaumes enden. Die Ereignisfolge 1. Wurf Wappen und 


172 


1/2 @ > 
1/72 2 1/72 


la) 7 
1/2 12 


(2) Zahl 
1/2 (w) 





Abb. 3.6 Wahrscheinlichkeitsbaum eines dreifachen Münzwurfes 
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2. Wurf Zahl (das Ereignis des dritten Wurfes bleibt offen) beträgt ın der Multiplikation 


der relevanten Äste: Ei ’ 

P(Z|W) = De (3.7) 
Wenn sich Ereignisse aus mehreren parallelen Pfaden eines Baumdiagramms zusammen- 
setzen, so ergibt sich die Wahrscheinlichkeit dieses Ereignisses durch die Addition der 
Pfadwahrscheinlichkeiten (Pfadadditionsregel). Interessiert die Wahrscheinlichkeit, ein- 
mal eine Zahl und zwei Mal ein Wappen geworfen zu haben, so sınd die Wahrscheinlich- 


keiten der Pfade (Z|W|W), (W|Z|W) und (W|W|Z) zu addieren. Es ergibt sich: 


I 1 13 
P(ZIWIW) + P(WIZIW) + PWIWIZ)= +2 +2 = 5- (3.8) 


00 


Wahrscheinlichkeitsbäume eignen sich immer dann, wenn eine geringe Anzahl mehr- 
stufiger Experimente bei gleichzeitig geringer Anzahl möglicher Ereignisse vorliegen 
und die Reihenfolge von Ereignissen eine Rolle spielt. Bei einer großen Anzahl mög- 
licher Ereignisse und auch bei Fragestellungen, bei denen die Reihenfolge gezogener 
Elemente keine Rolle spielt, hilft die Kombinatorik bei der Berechnung von Laplace- 
Wahrscheinlichkeiten. 


3.3.22 Kombinatorik 


Die Kombinatorik ist nicht nur die Grundlage der Berechnung von Laplace-Wahrschein- 
lichkeiten, sondern beschäftigt sich generell mit der Auswahl und Anordnung von Ele- 
menten, die aus einer endlichen Menge bzw. Grundgesamtheit entnommen werden. Sie 
ist darüber hinaus Grundlage von später noch vorgestellten statistischen Verteilungen, 
wıe zum Beispiel der Binomial- oder der hypergeometrischen Verteilung. All dies sind 
gute Gründe dafür, sich mit dem Thema der Kombinatorik etwas ausführlicher zu be- 
schäftigen. Hartung (2009, S. 96) differenziert die Kombinatorik hinsichtlich der beiden 
Fragestellungen, „Wie viele Möglichkeiten gibt es, N Elemente anzuordnen?“ und „Wie 
viele Möglichkeiten gibt es, von N Elementen k auszuwählen?“. Zur Beantwortung der 
ersten Frage müssen Permutationen, zur Beantwortung der zweiten Frage entweder Kom- 
binationen oder Variationen berechnet werden. 

Beginnen wir zunächst mit der Berechnung der Anzahl von Permutationen. Der Begriff 
Permutation beschreibt zunächst einmal nur eine mögliche Anordnung von N verschiede- 
nen Elementen einer gegebenen Menge, wobei jedes Element genau nur einmal vorhanden 
ist oder jedes Element nur einmal ausgewählt werden kann. Nehmen wir beispielsweise 
einmal an, dass ein Kunde drei verschiedene Werbeformen unseres Produktes gesehen hat. 
Wir wissen aber nicht, in welcher Reihenfolge er diese gesehen hat. Die Reihenfolge erst 
Werbeform 1, dann Werbeform 2 und dann Werbeform 3 bildet nur eine mögliche Anord- 
nung, genau wie die umgekehrte Reihenfolge, erst Werbeform 3, dann Werbeform 2 und 
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dann Werbeform 1. Insgesamt lassen sich die drei Werbeformen in 
Pe 1l993=%6 (3.9) 


unterschiedlich mögliche Reihenfolgen bringen.* Man spricht in diesem Fall auch von 
einer Permutation ohne Wiederholung. Jede Reihenfolge hat eine Laplace-Wahrschein- 
lichkeit von P = 1/6. Allgemein aufgeschrieben, lässt sich die Anzahl der Permutationen 
ohne Wiederholung von N unterschiedlichen Objekten wie folgt berechnen: 


PN =N!, (3.10) 


Eine Permutation mit Wiederholung liegt vor, wenn mindestens zwei Elemente identisch 
oder nicht unterscheidbar voneinander sind. In einem solchen Fall existieren k verschiede- 
ne Gruppen von Elementen. Nehmen wir z.B. an, unser Unternehmen hätte nun insgesamt 
vier Werbeformen geschaltet. Es bestehen im Falle von Permutation ohne Wiederholung 
insgesamt 

P=ede)4 (3.11) 


unterschiedlich mögliche Reihenfolgen der vier Werbeformen. Nun hat eine Werbung 
einen grünen, eine einen roten und zwei haben einen blauen Hintergrund. Es liegen so- 
mit Werbungen mit k = 3 Gruppen von unterschiedlichen Hintergrundfarben — also mit 
Wiederholungen —- vor und wir fragen uns, wie viele unterschiedliche Anordnungen der 
Werbeformen es ın diesem Fall gibt. Es müssen zwangsläufig weniger als im Fall ohne 
Wiederholung sein, denn bestimmte Anordnungen sind nicht mehr unterscheidbar, gelten 
somit als identisch und werden als nur eine Anordnung gezählt. So sind die Permutationen 
„Grün, Rot, Blau 1, Blau 2° und „Grün, Rot, Blau 2, Blau 1° im Sinne der Hintergrundfar- 
be identisch und zählen als eine und nicht als zwei mögliche Anordnungen. Rechnerisch 
ermittelt man die Anzahl der Permutationen mit Wiederholung durch 


PN — T 3.12 
Teen u 


Dabei entspricht die Anzahl der Gruppenelemente N der aufaddierten Anzahl der Ele- 
mente der k Gruppen: 


k 


i=1 


*Das Ausrufezeichen im Ausdruck n! bezeichnet die mathematische Funktion der Fakultät. Die 
Fakultät der Zahl n berechnet sich aus dem Produkt aller natürlichen Zahlen kleiner oder gleich n: 


n 
eine 
k=1 
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Abb. 3.7 Kombination und Variation (Quelle: Wewel (2014, S. 168). Veränderte Darstellung) 


Für das Beispiel der Hintergrundfarben ergibt sich somit: 


4 4! 


Geht es nun nicht mehr um die Anordnung, sondern um die Auswahl von k Elementen 
aus einer Menge von N Elementen, spricht man von Variationen, wenn die Ziehungsrei- 
henfolge von Bedeutung ist und von Kombinationen, wenn die Ziehungsreihenfolge keine 
Rolle spielt. Auch hier bestehen jeweils die Optionen mit und ohne Zurücklegen bzw. 
Wiederholungen (vgl. Abb. 3.7). 

Die Situation einer Kombination ohne Zurücklegen und ohne Berücksichtigung der 
Reihenfolge entspricht der beim Lottospiel: Aus einer Anzahl von N Kugeln werden 
n Kugeln gezogen, wobei bereits gezogene Kugeln nicht wieder in die Urne zurückge- 
legt werden. Dabei ist die Ziehungsreihenfolge der Kugeln für den Gewinn unerheblich. 
Lediglich ob eine Zahl gezogen wird oder nicht, ist von Bedeutung. Die Anzahl der mög- 
lichen Kombinationen berechnet sich entsprechend der Formel. 


CN = al. 0 m 3.15 
" An) nUN-n)! wi 


(\ ) wird dabei als Binomialkoeffizient bezeichnet. Insgesamt bestehen somit, bei sechs 
aus 49 gezogenen Kugeln, folgende unterschiedliche Zahlenkombinationen: 


„ [49 49! 
= — — = 13.983.816. (3.16) 
6 6149 — 6)! 
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Lesehilfe: 


Vier Personen spielen zwei Pokerpartien: Im Fall mit Zurücklegen (mit Wiederholung) 
und bei Berücksichtigung der Reihenfolge der Gewinner (Variation mit Zurücklegen), 
bestehen theoretisch 16 unterschiedliche Gewinnermöglichkeiten. Spielt die Reihenfolge 
des Auftretens der Gewinner hingegen keine Rolle, entfallen bei Zurücklegen die grau 
markierten Kombinationen, da diese bereits an anderer Stelle berücksichtigt sind (z.B. 
Spieler 1 gewinnt erste und Spieler 2 die zweite Partie ist identisch zum Ergebnis Spieler 2 
gewinnt erste und Spieler 1 die zweite Partie). Für den Fall mit Zurücklegen und ohne 
Berücksichtigung der Reihenfolge (Kombination mit Zurücklegen) ergeben sich 
theoretisch zehn unterschiedliche Kombinationen. 


Abb. 3.8 Ereignisbaum für Gewinnerkombinationen und -variationen bei vier Spielern und zwei 
Spielen 


Etwas komplizierter ist die Berechnung der Kombinationen mit Zurücklegen. Dieser Fall 
trıtt immer dann ein, wenn Elemente bei mehrfachen Ziehungen auch mehrfach ausge- 
wählt werden können und die Reihenfolge der Ziehung unerheblich ist. Angenommen, 
vier Personen spielen zwei Pokerpartien und Sie wollen wissen, wie viele unterschied- 
liche Kombinationen von Gewinnern es theoretisch gibt. Im Gegensatz zum Lottospiel, 
kann hier jeder Spieler auch öfters als einmal als Sieger „gezogen werden“, also ein Spiel 
gewinnen. Dabei interessiert Sie lediglich, wie oft und nicht in welchem Spiel die einzel- 
nen Spieler jeweils gewonnen haben. Die Berechnung dieser Kombination erfolgt gemäß 
der Formel: 


= N+n-| 
ee Y >17) 
n 
Bei N = 4 Spielern und n = 2 Pokerpartien existieren zehn unterschiedliche Sie- 


gerkombinationen, die sich lediglich durch die Anzahl der Siege einzelner Teilnehmer 
unterscheiden (vgl. Abb. 3.8): 


ae N _ 5! 
. 2 2 2165 — 2)! 


— 10. (3.18) 


Spielt bei den Pokerspielen die Reihenfolge der Gewinner eine Rolle, erfolgt die Berech- 
nung über die Formel für die Variation mit Zurücklegen. Im ersten Spiel können vier 
unterschiedliche Spieler gewinnen. Nach dem zweiten Spiel existieren bereits 4-4 = 16 
unterschiedliche Gewinnvariationen. Für n = 2 Spiele und N = 4 Spieler ergeben sich 
wegen 

VN=N" (3.19) 


insgesamt v; — 4° = 16 Gewinneroptionen (vgl. Abb. 3.8). 
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Lesehilfe: 
Vier Personen spielen zwei Pokerpartien. Sobald ein Spieler ein Spiel gewonnen 
hat, muss er den Spieltisch verlassen (Variation ohne Zurücklegen). 


Abb. 3.9 Ereignisbaum für Gewinnervariationen (ohne Wiederholung) bei vier Spielern und zwei 
Spielen 


Auch die Berechnung einer Variation ohne Zurücklegen durch die Formel 


VN“ =n! NT (3.20) 
" \n (N —n)! 


lässt sich mit Hilfe des Pokerspiels zeigen. Wieder wollen Sie wissen, wie viele unter- 
schiedliche Reihenfolgen von Gewinnern es bei n = 2 Pokerpartien und N = 4 Spielern 
gibt, wenn jeder Spieler bei einem Spielgewinn den Spieltisch verlassen muss (ohne Zu- 
rücklegen bzw. ohne Wiederholung). Es ergeben sich 


V; = on 12 (3.21) 
a2)! | 
unterschiedliche Möslichkeiten (vgl. Abb. 3.9). 

Zugegebenermaßen ist es nicht üblich, dass gerade der Gewinner den Spieltisch zu 
verlassen hat. Dennoch sind Variationen ohne Zurücklegen sehr praxisrelevante Fragestel- 
lungen, wenn es beispielsweise darum geht, Zulieferer auszuwählen. Wie viele mögliche 
Rangfolgen gibt es beispielsweise, wenn aus 20 Zulieferern insgesamt drei zum Zuge 
kommen sollen und der erste Bewerber 50 Prozent, der zweite 30 Prozent und der dritte 
20 Prozent der Auftragssumme erhalten soll. Die Reihenfolge spielt in diesem Fall aus der 
Sicht der Zulieferer eine maßgebliche Rolle für den Umfang der Auftragssumme. Insge- 


samt ergeben sich 
20! 


00-3)! 


unterschiedliche Variationen. Erfahrungsgemäß fällt es Studierenden zu Beginn sehr 


V — 6840 (3.22) 


schwer zu entscheiden, ob in einer gegebenen Situation eine Permutation, eine Kombi- 
nation oder eine Variation vorliegt. Bourier (2018) schlägt deshalb ein algorithmisches 
Vorgehen zur Entscheidungsfindung vor, das ın Abb. 3.10 zusammengefasst ist. 


N 
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Ist jedes Element einmal ja Sind die Elemente alle ja > 
Permutation ohne Wiederholung 
anzuordnen? verschiedenen? = 


nein nein Permutation mit Wiederholung 
Darf ein El hol j Ist die Reihenfol ——: FETT 
arf ein Element wiederholt | ja st die Reihenfolge der ja VE Eee 
ausgewählt werden? Elemente von Bedeutun > 
= Kombination mit Wiederholung 


nein 
Isr die Reinentolge der F Variation ohne Wiederholun 
Elemente von Bedeutung 
— Kombination ohne Wiederholung 


Abb. 3.10 Entscheidungsfindung zu Permutation, Kombination oder Variation (in Anlehnung an 
Bourier (2018). Eigene Darstellung) 


3.3.3 Additionssatz disjunkter Ereignisse 


Liegen die Wahrscheinlichkeiten für die einzelnen Ereignisse vor und soll die Wahr- 
scheinlichkeit für deren Auftreten berechnet werden, findet der sogenannte Additionssatz 
Anwendung. Dabei ist zu unterscheiden, ob sich die Ereignisse gegenseitig ausschließen 
(disjunkt sind) oder nicht. Die Wahrscheinlichkeit zweier sich ausschließender Ereignisse 
A und B-es giltalso P(ANB) = {}- entspricht der Summe der Einzelwahrschein- 
lichkeiten der Ereignisse A und B- P(AUB) = P(A) + P(B). Bei mehreren sich 
gegenseitig ausschließenden Ereignissen gilt entsprechend: 


P (Ü 4) — 5 P(A,). (3.23) 


i=1 i=1 


Nehmen wir das einfache Beispiel eines Würfelexperiments: Die Wahrscheinlichkeit, eine 
gerade Augenzahl zu werfen, entspricht der Summe der Einzelwahrscheinlichkeiten für 
das Werfen der Zahlen zwei, vier und sechs. Bei einem fairen sechsseitigen Würfel ist 
die Wahrscheinlichkeit für das Werfen dieser Zahlen jeweils 1/6, sodass sich folgende 
Gesamtwahrscheinlichkeit ergibt: 


P (gerade Zahl) = P(2) + P(4) + P(6) = 1/6+1/6+1/6 = - — 50%. (3.24) 


Oder ein weiteres Beispiel: In einer Lostrommel mit 1000 Losen befinden sich zehn ers- 
te und achtzig zweite Preise. Die Einzelwahrscheinlichkeiten für die Ereignisse „Erster 
Preis“ und „Zweiter Preis“ sind damit: 


P (Erster Preis) = 10/1000 = 1% und P (Zweiter Preis) = 80/1000 = 8%. (3.25) 


Mit keinem Los erhält man gleichzeitig einen ersten und einen zweiten Preis, sodass sich 
die Ereignisse gegenseitig ausschließen und die entsprechende Schnittmenge eine leere 
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a 2 |» a | 5. ° 
1 0,2268% 0,4535% 0,6803% 0,9070% 1,1338% 1,3605% 
2 0,4535% 0,9070% 1,3605% 1,8141% 2,2676% 2,7211% 


3 0,6803% 1,3605% 2,0408% 2,7211% 3,4014% 4,0816% 
4 0,9070% 1,8141% 2,7211% 3,6281% 4,5351% 5,4422% 
5 


1,1338% 2,2676% 3,4014% 4,5351% 5,6689% 6,8027% 
6 1,3605% 2,7211% 4,0816% 5,4422% 6,8027% 8,1633% 


Abb. 3.11 Wahrscheinlichkeiten beim unfairen Würfelexperiment 


Menge ergibt. Die Wahrscheinlichkeit eines Gewinns ist die Summe der Wahrscheinlich- 
keiten eines ersten und eines zweiten Preises: 


P (Erster Preis U Zweiter Preis) = 0,01 +0,08 = 9%. (3.26) 


Ein besonderer Fall sich ausschließender Ereignisse ist der Fall komplementärer Ereignis- 
se (A°). Wie bereits geschildert, ergänzen sich zwei solcher Ereignisse zur Gesamtmenge 
&2. Entsprechend addieren sich auch die Wahrscheinlichkeiten zu Eins (P(AU B) = 
P(®) = 1), sodass eine Wahrscheinlichkeit immer mit Hilfe der anderen berechnet wer- 
den kann. Es gilt: 

P(A)=1-P(A)=1-P(B). 3.27) 


Die Kenntnis dieses Zusammenhangs ist vor allem dann hilfreich, wenn eine der beiden 
Wahrscheinlichkeiten aufwändig und die andere einfach zu berechnen ist. Nehmen wir 
das Beispiel eines Würfelexperiments mit zwei manipulierten Würfeln, bei der nicht jede 
Augenzahl die gleiche Wahrscheinlichkeit besitzt. Wie groß ist nun die Wahrscheinlichkeit 
einer Augenzahl kleiner als elf? In Abb. 3.11 sind alle Kombinationsmöglichkeiten und 
deren Wahrscheinlichkeiten dargestellt. 

Die Ermittlung von P(Augenzahl < 11) könnte nun durch Aufaddieren aller Ein- 
zelwahrscheinlichkeiten mit Kombinationen kleiner als elf Augen erfolgen. Dies wären 
insgesamt 33 Einzelwahrscheinlichkeiten. Da die Wahrscheinlichkeit P(Augenzahl > 11) 
komplementär hierzu ıst, kann die Berechnung auch hierüber erfolgen. Es müssen nur die 
grau markierten Einzelwahrscheinlichkeiten aufaddiert und dieser Wert von Eins abgezo- 
gen werden: 


P(Augenzahl < 11) = 1 — P(Augenzahl > 11) 
—= 1 — (6,8027 % + 6,8027 % + 8,1633 %) x 78,23%. (3.28) 
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3.3.4 Additionssatz nicht-disjunkter Ereignisse 


Etwas anders verhält sich die Addition von Wahrscheinlichkeiten bei nicht-disjunkten Er- 
eignissen. In einem solchen Fall existiert eine nicht leere Schnittmenge, die bei einfacher 
Addition der beiden Einzelwahrscheinlichkeiten doppelt gezählt würde. Man betrachte 
hierzu nochmals den Fall „Durchschnitt von Ereignissen“ ın Abb. 3.2. Die Wahrschein- 
lichkeit zweier sich nicht ausschließender Ereignisse A und B entspricht somit der Summe 
der Einzelwahrscheinlichkeiten der Ereignisse A und B abzüglich des Durchschnitts der 
beiden Ereignisse. Es gilt: 


P(AU B) = P(A) + P(B)-(ANB). (3.29) 


Ziehen wir wiederum das Würfelexperiment zur Verdeutlichung heran: Wie groß ist die 
Wahrscheinlichkeit dafür, eine gerade Augenzahl oder eine Augenzahl kleiner als vier zu 
würfeln? Die Ergebnismenge der Augenzahlen kleiner als vier entspricht A = {1,2,3}, 
die Ergebnismenge einer geraden Augenzahl entspricht B = {2,4,6Y. Es wird deutlich, 
dass beide Ergebnismengen eine gemeinsame Schnittmenge (AN B = {2}) mit einer 
Wahrscheinlichkeit von P(ANB) = 1/6 besitzen. Gemäß des Additionssatzes bei nicht- 
disjunkten Ereignissen ergibt sich somit für die gesuchte Wahrscheinlichkeit: 


P(AU B) = P(A) + P(B)- (AN B) = 3/6 + 3/6 - 1/6 = 5/6 x 83,3%. (3.30) 


33.5 Bedingte Wahrscheinlichkeiten 


Eine wichtige Fragestellung ist die Berechnung bedingter Wahrscheinlichkeiten. Betrach- 
ten wir hierzu zunächst ein Beispiel (Velleman 2002): Wissenschaftler am Baystate Me- 
dical Center in Springfield (Massachusetts) untersuchten das Geburtsgewicht von 189 
Neugeborenen. Insgesamt 59 Neugeborene (31 Prozent) wiesen ein geringes, 75 ein mitt- 
leres (40 Prozent) und 55 (21 Prozent) ein hohes Geburtsgewicht auf. Entsprechend hat 
eine schwangere Mutter eine Wahrscheinlichkeit von 31 Prozent für ein untergewichtiges 
Baby: P(Geringes Geburtsgewicht) = 59/189 & 31%. Die Wissenschaftler vermute- 
ten bei rauchenden Müttern eine größere Wahrscheinlichkeit für ein Baby mit geringem 
Geburtsgewicht als bei nicht rauchenden Müttern. In der Studie waren 74 Mütter Rauche- 
rınnen und diese brachten 30 Babys mit geringem Geburtsgewicht zur Welt. 

Die Wahrscheinlichkeit ein untergewichtiges Baby zu gebären liegt bei Raucherinnen 
also bei P(Geringes GeburtsgewichtlRaucherin) = 30/74 = 41%. Man spricht in ei- 
nem solchen Fall von einer bedingten Wahrscheinlichkeit (engl.: conditional probability). 
Bedingte Wahrscheinlichkeit deshalb, da eine Restriktion in Hinblick auf die Gruppe 
der zu betrachtenden Personen formuliert wird — hier die Raucherinnen. In der Notati- 
on wird die Bedingung mit einem senkrechten Strich vom Ereignis abgetrennt und wie 
folgt ausgedrückt: P (Ereignis|Bedingung). Die Berechnung erfolgt, indem man die Wahr- 
scheinlichkeit der Schnittmenge der beiden Ereignisse (P (Untergewicht N Raucherin)) 
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durch die Wahrscheinlichkeit der Bedingung (P(Raucherin)) teilt. Es ergibt sich für das 
obige Beispiel: 


w 
oO 


P(Unt icht N Raucheri eo... SO 
ae ne), 8 =041=41% (31) 
P (Raucherin) 74 
Für den generellen Fall gilt also: 
P(ANB 
PiAlB)= a) (3.32) 
P(B) 


3.3.6 Stochastische Unabhängigkeit von Ereignissen 


Sollte im vorangegangenen Beispiel das Gewicht unabhängig von der Tatsache sein, ob 
die Mutter Raucherin ist oder nicht, liegt die Wahrscheinlichkeit, untergewichtige Babys 
zu bekommen, sowohl für rauchende als auch für nicht rauchende Mütter bei 31 Prozent. 
D.h., es muss gelten P(Untergewicht|Raucherin) = P(Untergewicht) = 31%. Dies 
ist, wie wır oben bereits berechnet haben, nicht der Fall. Raucherinnen bringen in 41 
Prozent der Fälle ein untergewichtiges Kind zur Welt. Zwei Ereignisse sind also immer 
dann unabhängig, wenn das Eintreten eines Ereignisses (Raucherin) keinen Einfluss auf 
die Eintrittswahrscheinlichkeit des anderen Ereignisses (niedriges Geburtsgewicht) hat. 
Wir können also festhalten, dass zwei Ereignisse immer dann unabhängig voneinander 
sind, wenn folgendes gilt: 


P(A|B) = P(A) bzw. P(B|A) = P(B). (3.33) 


So hat das Ergebnis der Ziehung der Lottozahlen des vorherigen Samstags — bei ord- 
nungsgemäßem Zustand des Ziehungsgerätes und der 49 Kugeln - keinen Einfluss auf die 
Ziehung des folgenden Samstags. Auch sollte die Wahrscheinlichkeit des Bestehens der 
Statistikklausur unabhängig vom Leistungsergebnis des Studierenden am Nachbartisch 
sein. 


3.3.7 Multiplikationssatz 


Mit Hilfe des Multiplikationssatzes kann die Wahrscheinlichkeit für das gleichzeitige Ein- 
treten zweier Ereignisse berechnet werden. Während der Additionssatz die Wahrschein- 
lichkeiten für Ereignisse mit einem Inklusiv-ODER verknüpft, erfolgt die Berechnung 
beim Multiplikationssatz mit Hilfe einer UND Verknüpfung. Gesucht wird die Wahr- 
scheinlichkeit für das gleichzeitige Auftreten von zwei Ereignissen. Es gilt dann der ge- 
nerelle Multiplikationssatz: 


P(AN B) = P(A|B)- P(B) bzw. P(AN B) = P(B|A)- P(A). (3.34) 
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Abb. 3.12 Satz der Totalen 


Wahrscheinlichkeit © / || 


Mit Hilfe des Multiplikationssatzes kann ebenfalls stochastische Unabhängiskeit unter- 
sucht werden. Zwei Ereignisse sind unabhängig voneinander, wenn folgendes gilt: 





P(A|B) = P(AN B)P(B) = P(A). (3.35) 


Das ist allerdings nur dann der Fall, wenn P(ANB) = P(A): P(B) entspricht. Generell 
sind also zwei Ereignisse A und B unabhängig voneinander, wenn das Produkt der beiden 
Einzelwahrscheinlichkeiten dem der Wahrscheinlichkeit der Schnittmenge beider Ereig- 
nisse entspricht. Gilt hingegen P(A|B) # P(A) oder P(AN B) # P(A)- P(B) besteht 
ein Zusammenhang bzw. keine Unabhängigkeit. 


3.3.8 Satz der totalen Wahrscheinlichkeit 


Aus der Anwendung des Additions- und des Multiplikationssatzes lässt sich nun der Satz 
der Totalen Wahrscheinlichkeit herleiten. Angenommen, uns interessiert die unbedingte 
Wahrscheinlichkeit für ein Ereignis A (P(A)) und uns seien aber nur die bedingten Wahr- 
scheinlichkeiten P(A|B;) bekannt. Zudem wissen wir aber, dass es sich bei Bı,...B, 
um sich paarweise ausschließende Ereignisse und um eine Zerlegung des Ergebnisraumes 
(2 handelt. Abb. 3.12 verdeutlicht den Zusammenhang anhand eines Venn-Diagrammes: 
Bı,... B„ zerlegen der Ergebnisraum $2 in vier disjunkte Mengen. Die Menge A bildet 
sich aus der Addition der Schnittmengen von A mit den Mengen von Bı, B>, B3 und B,. 
Entsprechend gilt: 


P(A) = P(ANBı) + PIANB»)+... + P(AN B,). (3.36) 


Angewendet auf das Beispiel aus Tab. 3.1 bilden Raucherinnen und Raucher den Er- 
gebnisraum und zerlegen diesen in zwei disjunkte Mengen. Somit ergibt sich die Wahr- 
scheinlichkeit für ein niedriges Geburtsgewicht (P(Niedrig)) aus der Addition der Wahr- 
scheinlichkeiten der Schnittmengen für niedriges Geburtsgewicht bei Raucherinnen und 
bei Nichtraucherinnen. Es gilt somit: 


P (Niedrig) = P (Niedrig N Raucherin) + P (Niedrig N Nichtraucherin). (3.37) 
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Tab. 3.1 Geburtsgewichtsuntersuchung Baystate Medical Center 


Mutter Geburtsgewicht Summe 
Raucherin oder Nichtraucherin | Hoch Mittel Niedrig 

Keine Raucherin 42 44 29 115 
Raucherin 13 31 30 74 
Summe 55 75 59 189 


Quelle: Velleman, P. (2002, S. 14-1). 


Wenden wir hierauf den Multiplikationssatz an, so ergibt sich: 


P (Niedrig) = P(Niedrig|Nichtraucherin) - P(Nichtraucherin) 
+ P(Niedrig|Raucherin) - P(Raucherin) (3.38) 


29 115 30 74 39 
en Ze ı12 (3.39) 


Dreier nn 
(Niedrig) = 75° 189 * 74 189 189 


Die generelle Wahrscheinlichkeit für ein niedriges Geburtsgewicht beträgt somit 
P(Niedrig) = 31,2%. Dieser Wert wurde dabei aus den Werten des bedingten Eintre- 
tens von Ereignissen einerseits für Raucherinnen und andererseits für Nichtraucherinnen 
ermittelt. Für den Satz der Totalen Wahrscheinlichkeit gilt im Allgemeinen deshalb: 


P(A) = P(A|B)- P(B) + P(A|C)- P(C)+... + P(A|Z)- P(Z). (3.40) 


In Bezug auf das Beispiel aus Tab. 3.1 hätten wir die Lösung natürlich auch direkt aus 
der Tabelle ablesen können. Allerdings ist dies nicht immer möglich, wie folgendes Bei- 
spiel zeigt: Ein Unternehmen unterzieht seine Endprodukte einer maschinengesteuerten 
Qualitätskontrolle. Aus Erfahrung weıß man, dass die Wahrscheinlichkeit für ein defek- 
tes Produkt bei einem Prozent liegt (P(defect) = 1%). Die maschinelle Endkontrolle 
erkennt diese fehlerhaften Produkte mit einer Wahrscheinlichkeit von P(outldefect) = 
99 Prozent. In P (out|not defect) = 0,5 % der Fälle werden allerdings auch nicht defekte 
als defekte Endprodukte ausgewiesen. Es stellt sich die Frage, mit welcher Wahrschein- 
lichkeit sortiert die maschinelle Endkontrolle ein Produkt aus ( P(out))? Insgesamt bilden 
defekte und nicht defekte Produkte disjunkte Ereignisse, die den Ergebnisraum in zwei 
Teile zerlegen. Mit Hilfe des Satzes der Totalen Wahrscheinlichkeit werden die Ereignis- 
se, dass ein Produkt irrtümlicherweise aussortiert und dass ein Produkt richtiger Weise 
aussortiert wurde, über die Addition der beiden Schnittmengen zusammengefügt: 


P(out) = P(out N defect) + P(out N not defect) (3.41) 
P(out) = P(outldefect) - P(defect) + P(outlnot defect) - P (not defect). (3.42) 


Es ergibt sich somit eine Wahrscheinlichkeit der Produktaussortierung von: 


P (out) = 0,99. 0,01 + 0,005 - (1 0,01) = 0,149 = 1,49%. (3.43) 
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3.3.9 Das Theorem von Bayes 


Betrachten wir nun die aussortierten Produkte. Mit welcher Wahrscheinlichkeit handelt es 
sich wirklich um ein defektes Produkt (P(defectlout))? Diese Frage lässt sich mit Hilfe 
des Theorems von Bayes lösen. Die Herleitung des Zusammenhanges ist dabei wenig 
kompliziert: Aus Abschn. 3.3.6 wissen wir, dass sowohl die Gleichung P(AN B) = 
P(A|B)- P(B) als auch die Gleichung P(AN B) = P(B|A)- P(A) gelten. Beide lassen 
sich gleichsetzen, sodass die Gleichung P(A|B)- P(B) = P(B|A)- P(A) in das Theorem 
von Bayes überführt werden kann: 

P(A|B) = a) für P(B) >0. (3.44) 

P(B) 

Drückt man im Nenner P(B) nun noch mit Hilfe des Satzes der Totalen Wahrscheinlich- 
keit aus, so ergibt sich die allgemeine Formel für das Theorem von Bayes: 


P(B|A;)- P(A;) P(B|A;)- P(A;) m 
ren E-— meer ee re P(BI|A:)- P(A; 0. 
P(B) »”_, P(BJAj)- P(A,) “2 (B|A;)-P(A,) > 


P(A;|B) = 


(3.45) 
Auf unser Beispiel angewendet bedeutet dies, dass sich die Wahrscheinlichkeit eines zu 
Recht aussortierten Produktes ergibt aus: 


P(defect) 0,01 
P(out) "0,0149 





P (defectlout) = P(out|defect) - — 0,66 = 66%. (3.46) 


Dies bedeutet, dass rund jedes dritte aussortierte Produkt fälschlicherweise als Ausschuss 
deklariert wird. 

Bedingte Wahrscheinlichkeiten — wie sie auch durch das Theorem von Bayes berechnet 
werden - besitzen eine weitaus wichtigere Praxisrelevanz als einfache Einzelwahrschein- 
lichkeiten. Sie weisen uns auf Besonderheiten bestimmter Gruppen hin und decken Zu- 
sammenhänge zwischen Ereignissen auf. Auf der anderen Seite werden die Bedingungen 
in einer allgemeinen Diskussion gerne unterschlagen und Wahrscheinlichkeiten verdreht 
oder allgemeingültig gemacht. Krämer (2015) führt hierzu einige Beispiele auf, darunter 
folgendes: Zwei Drittel aller Trinker sind verheiratet. Dass das Eheleben Männer zur Fla- 
sche greifen lässt, ist dabei eine Fehlinterpretation, denn die bedingte Wahrscheinlichkeit 
der Verheirateten aus der Gruppe der Trinker (P (Verheiratet|Trinker) = 66 %) ist nicht 
identisch mit der bedingten Wahrscheinlichkeit, ein Trinker in der Gruppe der Verheirate- 
ten zu sein (P(Trinker| Verheiratet) = ?). Wie lässt sich nun aber die Wahrscheinlichkeit 
ermitteln, dass ein Verheirateter bzw. Unverheirateter zum Trinker wird? Erst der Ver- 
gleich dieser beiden bedingten Wahrscheinlichkeiten würde uns eröffnen, welche Gruppe 
mehr zur Alkoholsucht neigt: Verheiratete oder Unverheiratete”? 

Gelöst wird dieses Problem wiederum mit Hilfe des Theorems von Bayes. Die Wahr- 
scheinlichkeit, dass es sich bei einem beliebig herausgegriffenen Deutschen um eine 
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alleinstehende Person handelt, liegt beirund P(Alleinstehend) = 22 %°, die Wahrschein- 
lichkeit für Alkoholmissbrauch bei rund P(Trinker) = 2%. Daraus ergibt sich: 


P(Alleinstehend|Trinker) - P(Trinker) 0,33. 0,02 


P (Trinker\Alleinstehend) = u 
(Trinker|Alleinstehend) P (Alleinstehend) 0,22 


= 3,0%. 
(3.47) 
Verheiratete weisen eine geringere Wahrscheinlichkeit für eine Alkoholabhängigkeit auf, 
nämlich: 


P (Verheiratet|Trinker) - P(Trinker) _ 0,66 - 0,02 


P(Trinker| Verheiratet) = z 
(Trinker| Verheiratet) P (Verheiratet) 0,78 


= 1,1% 


(3.48) 
Wieder einmal wird deutlich, wıe wichtig die genaue Betrachtung bedingter Wahrschein- 
lichkeiten ist. Das Theorem von Bayes stellt somit die Möglichkeit dar, eine unbekannte 
bedingte Wahrscheinlichkeit mit Hilfe einer bekannten bedingten und zweier totaler (un- 
bedingter) Wahrscheinlichkeiten zu berechnen. 


3.3.10 Exkurs: Das Ziegenproblem 


Wir wollen das Theorem von Bayes anhand des sehr populären Ziegenproblems, das im 
englischen Sprachraum als Monty Hall Problem bezeichnet wird, nochmals verdeutlichen. 
Das Problem basiert auf der in den 1960er- und 1970er-Jahren in den USA ausgestrahlten 
TV-Show Let’s make a deal. Dem Kandidat dieser Show wurden drei geschlossene Türen 
gezeigt. Hinter einer dieser Türen befindet sich ein großer Preis — in der Regel war es 
ein PKW -, hinter den anderen beiden Türen ein Trostpreis — was auch mal eine Ziege 
sein konnte, weshalb dieses Problem auch Ziegenproblem genannt wird. Nachdem sich 
der Kandidat für eine der drei Türen entschieden hatte, ließ der Show-Master eine der 
beiden verbleibenden Türen öffnen. Dabei handelte es sich natürlich immer um eine Tür, 
hinter der nicht der Hauptpreis zu finden war. Dem Kandidat wurde nun die Gelegenheit 
gegeben, sich nochmals umzuentscheiden oder bei seiner ersten Auswahl zu bleiben. Ist 
die Wahrscheinlichkeit den Hauptpreis zu gewinnen höher, wenn sich der Kandidat um- 
entscheidet oder ist sie höher beim Verbleib bei der ersten Entscheidung? Oder ist es gar 
unerheblich, da die Wahrscheinlichkeiten gleich groß sind, nämlich fifty-Afty? 

Diese Frage ist breit’ diskutiert worden und einmal mehr bestätigte es sich, dass In- 
tuition und statistische Wahrheit manchmal weit auseinander liegen. Nachdem die Wis- 
senschaftlerin Marilyn vos Savant nämlich behauptete, dass ein Wechsel der Tür immer 


> Eigene Berechnungen. Als Alleinstehend werden alle Personen definiert, die nicht in familienähn- 
lichen Zusammenhängen leben (Statistisches Bundesamt 2009). 

° Rund 1,3 Millionen Bundesbürger gelten als alkoholabhängig (Drogenbeauftragte der Bundesre- 
sierung — Bundesministerium für Gesundheit 2009). 

7 Eine schöne Zusammenfassung der Diskussion findet sich bei Randow (2007). 


33 Grundlagen der Wahrscheinlichkeitsrechnung > 


die Gewinnwahrscheinlichkeit erhöht, erntete sie Missfallen und Spott und wie wir heute 
wissen: zu Unrecht. Es kann gezeigt werden, dass sich die Gewinn-Wahrscheinlichkeit 
verdoppelt, wenn der Kandidat von seiner ersten Wahl abrückt und sich für eine der ande- 
ren Türen entscheidet! 

Versuchen wiır dieses Problem zunächst ohne Formeln zu lösen. Es existieren insgesamt 
drei Türen. Bevor der Moderator die Tür öffnet, beträgt die Wahrscheinlichkeit, dass sich 
hinter einer beliebigen Tür der Hauptpreis befindet, P(Hauptpreis) = 1/3 = 33,3 %. 
Gehen wir davon aus, dass der Kandidat sich zunächst für Tür 1 entscheidet. Wie wird 
sich nun der Moderator verhalten? 


e Möglichkeit 1: Der Hauptpreis steht hinter Tür 1. In diesem Fall würde der Modera- 
tor entweder Tür 2 oder Tür 3 öffnen lassen, denn hinter beiden Türen steht nur ein 
Trostpreis. In diesem Fall würde der Kandidat verlieren, wenn er sich — abweichend 
von seiner ursprünglichen Wahl — umentscheidet. 

e Möglichkeit 2: Der Hauptpreis steht hinter Tür 2. In diesem Fall öffnet der Moderator 
Tür 3, denn er würde dem Kandidaten bei Öffnen der Tür 2 den Hauptpreis offenbaren. 
In diesem Fall würde der Kandidat den Hauptpreis gewinnen, wenn er sich umentschei- 
det. 

e Möglichkeit 3: Der Hauptpreis steht hinter Tür 3. In diesem Fall öffnet der Moderator 
Tür 2, denn er würde dem Kandidaten bei Öffnen der Tür 3 den Hauptpreis offenbaren. 
In diesem Fall würde der Kandidat den Hauptpreis gewinnen, wenn er sich umentschei- 
det. 


Es wird also deutlich, dass der Kandidaten durch Abweichung von seiner ursprünglichen 
Wahl in zwei von drei Fällen den Hauptpreis gewinnt. Diese Wahrscheinlichkeiten ändern 
sich auch dann nicht, wenn sich der Kandidat zunächst für Tür 2 oder für Tür 3 entscheidet. 
Es handelt sich um eine spiegelbildliche Anwendung der oben beschriebenen Vorgehens- 
weise. Der Zusammenhang lässt sich auch mit Hilfe des Wahrscheinlichkeitsbaumes in 
Abb. 3.13 darstellen. 

Marilyn vos Savant macht den Sinn des Wechselns anhand eines erweiterten Beispiels 
nochmals deutlich: „Yes; you should switch. The first door has a 1/3 chance of winning, 
but the second door has a 2/3 chance. Here’s a good way to visualize what happened. 
Suppose there are a million doors, and you pick door #1. Then the host, who knows what’s 
behind the doors and will always avoid the one with the prize, opens them all except door 
#777,777. You’d switch to that door pretty fast, wouldn’t you?“ 

Was hat das Ziegenproblem nun mit dem Theorem von Bayes zu tun? Nun, das Problem 
lässt sich auch hierüber lösen. Hierzu sind zunächst die Ereignisse 7; = {Hauptgewinn 
befindet sich hinter dem Tor i} und M; = {Moderator öffnet Tür j} zu definie- 
ren. Die Gewinnwahrscheinlichkeiten der drei Türen sind dabei zu Beginn P(T,) = 
P(T,) = P(T;) = 1/3. Zunächst entscheidet sich der Kandidat wieder für die erste Tür. 


8 Siehe hierzu: http://www.marilynvossavant.com/articles/gameshow.html. 
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Mögliche Kombinationen Strategie des Moderators: Strategie des Kandidaten 
aus Hauptgewinn und „Offne niemals die Tür mit „Wechseln“ 
Trostpreis dem Gewinn!” 


P(M, | T,)=0 & nn n 
öffnet Tür 199 
Tür 1: Gewi 
Tür 2: Ziege” PM, |T))=1/2 Zu Tür3 
Te öffnet Tür 2 P(M, | T,): P(T,)=1/6 
Moderator Zu Tür 2 
P(M, |T))-1/2 | öffnet Tür 3 P(M, | T,): P(T,)=1/6 
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Tür 1: Ziege 
Tür 2: Ziege 
Tür 3: Gewinn 


1) Öffnen nicht möglich, da dahinter der Hauptgewinn. 
2) Offnen nicht möglich, da diese Tür bereits durch den Kandidlten belegt ist. 





Annahme bei diesem Wahrscheinlichkeitsbaum ist, dass der Moderator weder die Tür mit dem 
Hauptpreis, noch die vom Kandidaten zuerst gewählte Tür öffnen darf. Angenommen wird außerdem, 
dass der Kandidat eine beliebige Tür auswählen kann, sich in diesem Beispiel für Tür 1 entscheidet. 
Entscheidet sich der Kandidat für eine andere Tür, handelt es sich lediglich um ein spiegelbildliches 
Problem, das die Gewinnwahrscheinlichkeit nicht verändert. Gewinnsituationen sind grau hinterlegt. 


Abb. 3.13 Wahrscheinlichkeitsbaum des Ziegenproblems 


Beispielhaft könnte dies auch für alle anderen Türen durchgerechnet werden, ohne dass 
sich hierdurch die Ergebnisse ändern würden. Der Moderator wird nun eine Tür mit einer 
Ziege Öffnen und diese damit von der weiteren Auswahl ausschließen. Dies kann nur 
entweder Tür 2 oder Tür 3 sein. Angenommen er Öffnet Tür 3, so stellt sich dem Kan- 
didaten die Frage, wie groß ist nun die Gewinnwahrscheinlichkeit bei einem Wechsel — 
gesucht wird also P(T}|M3) — und wie groß ist die Gewinnwahrscheinlichkeit bei keinem 
Wechsel — gesucht wird dann P(T}|M3)? Wir wissen zudem folgendes: 


e Wenn der Gewinn hinter Tür 3 wäre, würde der Moderator diese Tür nicht öffnen, da er 
den Gewinn offenbaren würde. Entsprechend hat dieses Ereignis gemäß der Spiellogik 
eine Wahrscheinlichkeit von Null: P(M3|\7;) = 0. 
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e Wenn der Gewinn hinter Tür 2 ist, kann der Moderator nur Tür 3 öffnen. Ansonsten 
würde er den Gewinn offenbaren: P(M3|T}) = 1. 

e Wenn der Gewinn hinter Tür 1 ıst, kann der Moderator Tür 2 oder Tür 3 öffnen. Ent- 
sprechend gilt: P(M3|T,) = 50 %. 


Die Anwendung des Theorems von Bayes ergibt nun: 


P(M3|T,)- P(Tı) 


PinIm)= — ed 
IM) = Senn) Pin) + PM, |T):- P(T) + PIM-|T): P(T}) 
1 1 
a ] 
2.3 
_ ze (3.49) 
1 1 1 1 
23 t1°3+0:3 3 
P(M-|T,)- P(T. 
PM; H)-2(I)+ FP@2 DJ): ?Pn) + PM IB): PB) 
— B 2 (3.50) 
= 101 1 12° " 
23 t1’3+0:3 3 


Es ist zu erkennen, dass sich der Wechsel für den Kandidaten lohnt, da die Gewinnwahr- 
scheinlichkeit größer ist, als im Fall, in dem er nicht wechseln würde. 


3.4 Übungsaufgaben zur Wahrscheinlichkeitsrechnung 


Aufgabe 1 
Inge ist Vertreterin für Haarwaschmittel und möchte 10 Friseure, die in verschiedenen 
Friseurgeschäften arbeiten, auf ihrer täglichen Verkaufstour besuchen. 


a. Wie viele mögliche Touren gibt es für Inge? 

b. Von den 10 Friseuren haben 5 blonde Haare, 3 schwarze Haare und 2 rote Haare. 
Wie viele mögliche Touren gibt es, wenn Inge die Friseure nur nach der Haarfarbe 
unterscheiden kann’? 

c. Inge möchte 6 der 10 Friseure zu ihrem 25. Geburtstag einladen. Wie viele Möglich- 
keiten hat sie? 


Aufgabe 2 

Zwanzig Unternehmer haben jeweils eine freie Stelle ausgeschrieben. Im Arbeitsamt lıe- 
gen zwanzig Arbeitsgesuche vor, die zu diesen Stellen passen. 16 Anträge sind von Frauen 
und 4 Anträge von Männern. Wie viele verschiedene Möslichkeiten, die Arbeitsuchenden 
den Arbeitsstellen zuzuweisen, hat der Sachbearbeiter des Arbeitsamtes, wenn er die An- 
tragsteller nur nach ihrem Geschlecht unterscheidet? 
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Aufgabe 3 
Ein Marketingleiter möchte aus Kostengründen seine Werbefilme nur noch in drei Fern- 
sehprogrammen laufen lassen. Es kommen die Sender ARD, ZDF, RTL, SATI und PRO 
7 in Frage. 


a. Wie viele Möglichkeiten gibt es für den Marketingleiter, drei verschiedene Sender aus- 
zuwählen? Schreiben Sıe die Möglichkeiten auf! 

b. Der Marketingleiter möchte die Werbespots fünf Mal täglich ın den drei ausgewählten 
Kanälen platzieren. Dabei soll auch der Fall zulässig sein, dass ein Spot in einem Sen- 
der mehrfach laufen kann. Wie viele Möglichkeiten hat er, wenn die Reihenfolge der 
gesendeten Spots keine Rolle spielt? 


Aufgabe 4 


a. An einem Pferderennen nehmen zehn Pferde teil. Wie viele Möglichkeiten gibt es, die 
ersten drei Pferde in der richtigen Reihenfolge ihres Einlaufes zu tippen? 

b. In einem Leichtathletikverein sind sechs gleichwertige Sprinter, aus denen eine 4x 100- 
Meter-Staffel zusammengestellt werden soll. Wie viele Möglichkeiten gibt es dazu, 
wenn zwischen den einzelnen Staffelplätzen unterschieden werden soll? 


Aufgabe 5 

Ein Zigarettenautomat hat zwölf Fächer. Es stehen zehn verschiedene Zigarettenmarken 
zur Verfügung. Wie viele Möglichkeiten gibt es, den Automaten zu bestücken, wenn es 
nur auf die Anzahl der Packungen einer Marke im Automaten ankommt? 


Aufgabe 6 

Frisörin Inge aus Aufgabe 1 kennt 50 Friseure. Wie groß ist die Wahrscheinlichkeit, dass 
mindestens zwei der 50 Friseure am gleichen Tag Geburtstag haben? Die Aufgabe ist auch 
als das sogenannte „Geburtstagsparadoxon“ bekannt. 


Aufgabe 7 

In einer Statistikvorlesung sitzen 100 Studierende. Zur Klausurvorbereitung stehen beim 
AStA zwei alte Klausuren zur Verfügung. 50 % der Studierenden lösen die Klausur 1. 
15 % der Studierenden lösen die Klausur 1, aber nicht die Klausur 2. 20 % bearbeiten die 
Klausur 2, aber nicht die Klausur l. Man wählt zufällig einen Studenten aus. A sei das 
Ereignis, dass er Klausur 1 bearbeitet, B, dass er Klausur 2 bearbeitet. 


a. Stellen sie durch geeignete Verknüpfungen von A und B folgende Ereignisse dar und 
bestimmen Sie deren Wahrscheinlichkeiten! Der ausgewählte Student bearbeitet 1. kei- 
ne Klausur, 2. genau eine Klausur, 3. beide Klausuren, 4. wenigstens eine Klausur, 
5. höchstens eine Klausur. 

b. Sind die Ereignisse stochastisch unabhängig? Begründen Sie Ihre Antwort! 

c. Man wählt unter den Studenten, die Klausur 1 lösen, zufällig einen aus. Mit welcher 
Wahrscheinlichkeit löst dieser auch Klausur 2? 
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Aufgabe 8 

Kurz nach der Einführung des Euro nımmt die Versuchung, die Umstellung zur Ver- 
wendung von Falschgeld auszunutzen, zu. Die Wahrscheinlichkeit, dass ein Euroschein 
gefälscht ist, liege bei 0,5 %. Der Handel schläft jedoch nicht und installiert an den Kassen 
Detektoren zur Erkennung von Falschgeld. Diese erkennen einen gefälschten Euroschein 
in 95 % der Fälle. Allerdings liefern sie auch mit 1 %-iger Wahrscheinlichkeit das Ergeb- 
nis, dass ein Euroschein gefälscht ist, wenn es sich um echte Euros handelt. 


a. Mit welcher Wahrscheinlichkeit weisen die Detektoren auf Falschgeld hin? 
b. Mit welcher Wahrscheinlichkeit handelt es sich wirklich um den Versuch eines Be- 
trugs, wenn der Detektor Falschgeld signalisiert? 


Aufgabe 9 

Aus Erfahrung weiß man, dass 78 % der Studenten die Statistikklausur bestehen. Von den 
Studenten, die bestanden haben, fahren 67% nach Bekanntgabe der Ergebnisse in den 
Urlaub. Diejenigen, die durchfallen, lernen lieber noch mehr. Von ihnen fahren aber auch 
25 % nach Bekanntgabe der Klausurergebnisse für eine Weile weg. 


a. Stellen Sie die Zusammenhänge mit Hilfe eines Wahrscheinlichkeitsbaumes dar! 

b. Mit welcher Wahrscheinlichkeit macht ein Student nach Bekanntgabe der Klausurer- 
gebnisse Urlaub? 

c. Sie rufen einen Kommilitonen an und hören von seinem Anrufbeantworter „Bin nicht 
da! Bin auf Teneriffa!“ Mit welcher Wahrscheinlichkeit hat er die Statistikklausur be- 
standen? 


Aufgabe 10 

Ein Marktforschunssinstitut stellt fest, dass in einer Branche 80 % aller neu konzipier- 
ten Produkte Flops sind. Selbst, wenn die Entscheidung für die Massenfertigung der 
neuen Produkte vom Ergebnis eines Testmarktes abhängig gemacht wird, sind Fehlent- 
scheidungen nicht ausgeschlossen. Aus den bisherigen Erfahrungen ist bekannt, dass bei 
erfolgreichen Produkten in 70% der Fälle ein gutes Testmarktergebnis erzielt wird. In 
20 % wird ein mittleres und in 10 % der Fälle ein schlechtes Testmarktresultat erzielt. Bei 
Flops ist es gerade umgekehrt. 


a. Stellen Sie die Zusammenhänge mit Hilfe eines Wahrscheinlichkeitsbaumes dar! 

b. Wie groß ist die Wahrscheinlichkeit, dass der Testmarkt ein gutes Ergebnis liefert’ 

c. Ein Produkt hat ein gutes Testmarktresultat erzielt. Mit welcher Wahrscheinlichkeit 
wird das Produkt dennoch ein Flop? 

d. Wie groß ist die Wahrscheinlichkeit, dass ein Produkt ein gutes Testmarktergebnis er- 
zielt oder ein Flop wird? 

e. Wie groß ıst die Wahrscheinlichkeit, dass ein Produkt ein schlechtes Testmarktergebnis 
erzielt und ein Flop wird’? 
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Aufgabe 11 
Drei Maschinen A, B, C produzieren 50 %, 30 % und 20 % der gesamten Produktion eines 
Betriebes. Die Ausschussanteile der Maschinen betragen 3 %, 4% und 5 %. 


a. Stellen Sie die Zusammenhänge mit Hilfe eines Wahrscheinlichkeitsbaumes dar! 

b. Wie groß ist die Wahrscheinlichkeit für das Ereignis, dass ein zufällig ausgewähltes 
Stück defekt ist? 

c. Mit welcher Wahrscheinlichkeit stammt ein zufällig ausgewähltes defektes Stück von 
Maschine A? 

d. Mit welcher Wahrscheinlichkeit stammt ein Produkt von Maschine A oder ist defekt? 

e. Mit welcher Wahrscheinlichkeit stammt ein Produkt von Maschine B und ist nicht 
defekt? 


Aufgabe 12 
Die Fertigungskontrolle einer Lackiererei eines Automobilherstellers registriert die la- 
ckierten Karosserien als: 


AT - fehlerfrei mit P(AT) = 0,85 
AF - Läufer vorhanden mit P(A5) = 0,12 
A3 — Blasen vorhanden mit P(A3) = 0,08 


A; bedeutet fehlerfrei; A, nur Läufer vorhanden; A; nur Blasen vorhanden; A, Läufer 
und Blasen vorhanden. 


Stellen Sie die Ereignisse A|, Aa, Az und Ay mit Hilfe eines Venn-Diagramms dar! 
Berechnen Sie die Wahrscheinlichkeiten für A;,i = 1,2,3,4! 

Sind A} und AZ unabhängige Ereignisse? 

. Wie groß sind die bedingten Wahrscheinlichkeiten P(A3|A3) und P(A3|A5)? 


nor» 


3.5 Lösungen der Übungsaufgaben 
Lösung 1 


a. Hier liegt eine Permutation von N verschiedenen Elementen vor: 

Es gilt P{Y = N! und somit existieren P,\) = 10! = 3.628.800 mögliche Touren. 

b. Hier liegt eine Permutation von N Elementen bei k unterschiedlichen Gruppen vor: 
Es gilt: 2. on > nm —= 5 und somit existieren 2 = an = 2520 ver- 
schiedene Touren. 

c. Hier liegt eine Kombination ohne Zurücklegen vor. Aus zehn Friseuren werden sechs 


eingeladen. Dabei ist es unerheblich, in welcher Reihenfolge die sechs Personen 
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eingeladen wurden und somit existieren 210 Möglichkeiten: 


en IN\_ N, cn _f!\___ 10 _ 10 
2 n n“N —n)! i 6 6110-6)! 416! 


—= 210 Möglichkeiten. 
Lösung 2 
Es liegt eine Permutation von N Elementen bei k unterschiedlichen Gruppen vor: 
Somit bestehen P,\. .„, = urn > Piea = sur = 4845 verschiedene Möglich- 
keiten. 
Lösung 3 


a. Es handelt sich um eine Kombination ohne Zurücklegen. Es gilt also: 


N N! 
e = I 020 e — 2 = BEE — Es = 10 
n n“N —n)! 3 315-3)! 3121 


Lexikografische Anordnung: 


l 2 3 - 5 6 7 8 9 10 

ARD ARD ARD ARD ARD ARD PRO7 |PRO7 /PRO7 RTL 
PRO7 |PRO7T |PRO7 RTL RTL SATI RTL RTL SATI SATI 
RTL SATI ZDF SATI ZDF ZDF SATI ZDF ZDE ZDF 


b. Es handelt sich um eine Kombination mit Zurücklegen. Es gilt also: 
_ N — 1 = 3+5-1 2 
a ae = je 
n 3 3 


a. Es liegt eine Variation ohne Zurücklegen vor. Es existieren somit: 


Lösung 4 


N N N! 10 10! 10! ne 
V, =n! = — > V,; = —— = — = 720 Möglichkeiten. 
n (N —n)! (10-3)! 7! 


b. Es liegt eine Variation ohne Zurücklegen vor. Wenn die Reihenfolge der ersten vier 
Starter eine Rolle spielt, existieren somit: 


N N! 6! 
VN =n! = —— — Vf = ——— = 360 Möglichkeiten. 
n (N —n)! (6-4)! 
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Lösung 5 

Es handelt sich um eine Kombination mit Zurücklegen (auch 12 Marlboro möglich) und 

ohne Berücksichtigung der Reihenfolge (es kommt nur auf die Anzahl der Packungen an) 
Es existieren somit CN = (" """) > CI = ("7") = (15) = 293.930 Möglich- 

keiten. 





Lösung 6 
Das Jahr habe N = 365 Tage. 
Br En Möglichkeiten haben alle n Personen an verschiedenen Tagen 


Geburtstag (Variation ohne Wiederholung). Bei n Personen gibt es insgesamt > = 
365” Möslichkeiten der Geburtstagszusammenstellung (Variation mit Wiederholung). Es 
sei: 


A: Alle n Personen haben an verschiedenen Tagen Geburtstag 
A: Mindestens zwei Personen haben am gleichen Tag Geburtstag 


365! 
_ ran 365-364 -....365—_n+1 
Deere nel). 
365" 365" 


= 0.970317 


Beispiele für Wahrscheinlichkeiten von mindestens zwei gleichen Geburtstagen bei unter- 
schiedlichen Gruppengrößen (n): 


n 2 10 20 25 30 40 60 80 
P(A) 0,27% 9,46% 41,14% | 56,86% 70,63% |89,12% 99,41% | 99,99 % 


Lösung 7 


A: 1. Klausur bearbeitet; B: 2. Klausur bearbeitet; 
A: 1. Klausur nicht bearbeitet: B: 2. Klausur nicht bearbeitet: 


B 0,35 02 0,55 
B u > 0,45 


0,5 05 






1. P(ANB)=0,3 

2. P(AUB)-P(ANB) = P(A)- P(ANB)+ P(B)-P(ANB) = 0,55 —0,35+ 
05-053 
oder alternativ: PCAN B)+ P(ANB) = 0,15 + 0,2 = 0,35 
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3. P(ANB) =0,5 
4. P(AUB) = P(A)+ P(B)- P(ANB) =0,7 
oder alternativ: POAN B)+ P(ANB)+ P(ANB) = 0,35 + 0,2+ 0,15 = 0,7 
5. 1- P(AnB) = 0,65 
oder alternativ: PCANB) + P(ANB) + P(AN B) = 0,3 + 0,2 + 0,15 = 0,65 
b. Die Ereignisse sind stochastisch abhängig. Sie wären unabhängig, wenn P(A) = 
P(A|B). 
Begründung: P(A) = 0,5 # P(AlB) = gr = 95 = 0,636 
c. Folgende Formel findet Anwendung: 





P(ANnB) 0,35 


oder über das Theorem von Bayes: P(B|A) = za ED mu =0| 


P(A) 


Lösung 8 


a. Ereignisse: 
F: Falschgeld; F: kein Falschgeld; D: Detektor signalisiert Falschgeld; D: Detektor 
signalisiert kein Falschgeld. 
Es ergeben sich folgende Wahrscheinlichkeiten: 
P(F) = 0,005; P(F) = 0,995; P(D|F) = 0,95; P(D|F) = 0,01. 
Nach dem Satz der Totalen Wahrscheinlichkeit beträgt die Wahrscheinlichkeit, dass 
die Detektoren auf Falschgeld hinweisen: 
P(D) = P(D|F): P(F) + P(D|F)- P(F) = 0,95 - 0,005 + 0,01 0,995 = 0,0147, 
d.h. mit einer Wahrscheinlichkeit von 1,47 % melden die Detektoren Falschgeld. 

b. Nach dem Theorem von Bayes gilt für die bedingte Wahrscheinlichkeit P(F|D), dass 
Falschgeld vorliegt, wenn der Detektor dies meldet: 
P(F|D) = DIR, _ 9.950.005 _ (0,323, d.h. mit einer Wahrscheinlichkeit von 


P(D) 0,0147 
32,3 % ist ein Euroschein wirklich gefälscht, wenn der Detektor Alarm auslöst. 





Lösung 9 


a. Ereignisse: 
B: Student hat die Statistikklausur bestanden 
B: Student hat die Statistikklausur nicht bestanden 
U: Student macht Urlaub 
U: Student macht keinen Urlaub 
Die Wahrscheinlichkeit für das Bestehen der Statistikklausur ist mit P(B) = 0,78 


gegeben. Für das Nichtbestehen gilt die Gegenwahrscheinlichkeit: 


P(B)=1=P(B)=1-0,783= 0,2. 
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Abb. 3.14 Wahrscheinlich- P(UJB) = 0,67 


keitsbaum Statistikklausur und 
Urlaub E02 
P(U! B)=1-P(U|B)=0,33 


P(UJB) = 0,25 
P(B)=0,22 < 


P(UIB) =1-P(U|B)=0,75 


Von den Studenten, die bestanden haben, fahren nach Bekanntgabe der Ergebnisse 
67 % in Urlaub. Also gilt: P(U|B) = 0,67. Diejenigen, die durchfallen, lernen lieber 
noch mehr. Von ihnen fahren aber auch 25 % nach Bekanntgabe der Klausurergebnisse 
für eine Weile weg. Also gilt: P(U|B) = 0,25. Es ergibt sich der Wahrscheinlichkeits- 
baum aus Abb. 3.14. 

b. Nach dem Satz der Totalen Wahrscheinlichkeit gilt: 


P(U) = P(U|B): P(B) + P(U|B): P(B) = 0,67: 0,78 + 0,22: 0,25 = 0,5776. 


Mit einer Wahrscheinlichkeit von 57,76 Prozent macht ein Student nach der Bekannt- 
gabe der Klausurergebnisse Urlaub. 

c. Nach dem Theorem von Bayes gilt: 
PiBU),= ne = ne —= 0,905. D.h., mit einer Wahrscheinlichkeit von 
90,5 Prozent hat der Kommilitone die Klausur wirklich bestanden. 
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a. Ereignisse: F: Flop; F: kein Flop 
T aut: Testmarkt liefert positives Ergebnis 
Twitteı: Testmarkt liefert mittleres Ergebnis 
Tschlecht: Testmarkt liefert schlechtes Ergebnis 


siehe für den Wahrscheinlichkeitsbaum Abb. 3.15 

b. Totale Wahrscheinlichkeit: P(Tgu) = 0,1: 0,8 + 0,7-0,2 = 0,22 (vgl. Abb. 3.15) 
c. Theorem von Bayes: 

PAR & Tau) Eu P(Tau|F) " 3 _ 0,1.0,8 


NE 


= — = 0,3636 
Pr P(Tau) 01-08207:02 


d. Additionssatz: P(FUTgu) = P(F)+P(Tou)-P(FNTau) = 0,8+0,22—0,1-0,8 = 
0,94 
e. Multiplikationssatz: P(F N Tsenlech) = P (Tscntecht| F) : P(F) = 0,7: 0,8 = 0,56 
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Abb. 3.15 Wahrscheinlich- Fi IF) -0,1 


keitsbaum Testmarkt 
P(F)=0,8 I P(Tyier\P) = 0,2 
PfIschlecht |P) =0,7 


P(Tu|9=0,7 


P(F) = 0,2 = P(Tyiter |P) = 0,2 
PfIschlecht F) =0,1 


Abb. 3.16 Wahrscheinlich- P(X| A) = 0,03 
keitsbaum defekte Produkte P(A)=0,5 = 
P(X|A) = 0,97 
P(X|B)= 0,04 
P(B)=0,3 =_ 
P(X|B) = 0,96 
P(X|C)=0,05 
P(C)=0,2 <— 
PX|C) =0,95 
Lösung 11 


a. Ereignisse: 
A: Teil auf Maschine A gefertigt 
B: Teil auf Maschine B gefertigt 
C: Teil auf Maschine C gefertigt 
X: Teil ist defekt 
X: Teil ist nicht defekt 


siehe für den Wahrscheinlichkeitsbaum Abb. 3.16 

b. Totale Wahrscheinlichkeit: P(X) = 0,03 : 0,5 + 0,04 - 0,3 + 0,05 - 0,2 = 0,037 (vgl. 
Abb. 3.16) 

c. Theorem von Bayes: 


P(ANX) _ P(X|A)- P(A) _ 0,03-0,5 


ea PX) PX) 0,037 


—= 0,4054 


d. Additionssatz: POAUX) = P(A)+ P(X)- P(ANX) = 0,5 + 0,037 - 0,03-0,5 = 
0,522 
e. Multiplikationssatz: P(BNX) = P(X|B):- P(B) = 0,96 : 0,3 = 0,288 
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Lösung 12 
a. 


Lackiererei 





b. P(Aı) = P(AT) = 0,85 
P(A,) = PA N A3) = 0,85 + 0,12 + 0,08 — 1 = 0,05 (Alle ohne: 1. ohne Fehler; 
2. mit Läufern; 3. mit Blasen) 
P(A>) = P(A5) —- P(A5ZN AZ) = 0,12 —0,05 = 0,07 (Alle mit Läufern ohne (Läufer 
mit Blasen)) 


P(A;) = P(A%) - P(A{ N A}) = 0,08 — 0,05 = 0,03 


c. P(A5N AZ) = 0,05 # P(A5) - P(A3) = 0,12: 0,08 = 0,096 — Abhängigkeit 
d. Es gilt: 


P(A%|A%) = ED — 


0,05 _ Plasmas) 
Pia) — 008 — 0,625 und P(A3|A5) = — 


_ 005 = 
Fe = 3 = 0,416 
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Zufallsvariablen und 
Wahrscheinlichkeitsverteilungen 


Im letzten Kapıtel haben wir verschiedene Gesetze und Rechentechniken rund um den 
Begriff der Wahrscheinlichkeit kennengelernt. In diesem Kapitel wollen wir darauf auf- 
bauend mehrere theoretische Wahrscheinlichkeitsverteilungen kennenlernen, die uns in 
die Lage versetzen sollen, in unterschiedlichen Situationen im wissenschaftlichen und 
praktischen Alltag von einer Stichprobe auf eine Grundgesamtheit schließen zu können. 
Allen diesen Wahrscheinlichkeitsverteilungen ist gemein, dass sie auf der Idee der Zufalls- 
variablen (engl.: random variable) basieren. Eine Zufallsvariable ist eine Variable, deren 
numerischen Werte Ergebnisse von Zufallsexperimenten sind. Zufallsvariablen werden 
mit einem lateinischen Großbuchstaben, z.B. „X“, symbolisiert. Die einzelnen Ausprä- 
gungen bzw. Werte der Zufallsvariablen werden entweder mit „X; “ oder mit ‚„x“ bezeich- 
net. Generell lassen sich zwei Typen von Zufallsvariablen unterscheiden: 


l. Es liegt eine diskrete Zufallsvariable (engl.: discrete random variable) vor, wenn die 
Ergebnisse der Zufallsexperimente endlich viele oder abzählbar unendlich viele Werte 
annehmen können. Häufig — aber nicht zwangsläufig — sind diese Werte ganzzahlıg 
(Wertebereich = No). Die Wahrscheinlichkeiten aller Merkmalsausprägungen addie- 
ren sich zum Wert Eins. Ein Beispiel für eine diskrete Zufallsvariable ist die Augenzahl 
beim Werfen eines Würfels. Die Zufallsvariable X entspricht der Augenzahl beim 
Werfen eines Würfels mit den möglichen Werten {1,2,3,4,5,6} für X;. 

2. Hingegen liegt eine stetige Zufallsvariable (engl.: continuous random variable) vor, 
wenn die Ergebnisse der Zufallsexperimente unendlich viele Werte annehmen können 
(Wertebereich = R). Diese unendliche Anzahl der Werte kann dabei durchaus auf 
ein Intervall beschränkt sein. Das Integral unterhalb der Wahrscheinlichkeitsfunktion 
weist im festgelegten Intervall einen Flächeninhalt von Eins auf. Ein Beispiel für eine 
stetige Zufallsvariable ist die Haltbarkeit von technischen Geräten. 


Für beide Typen von Zufallsvariablen lassen sich Wahrscheinlichkeitsverteilungen (engl.: 
probability distribution) bilden, die angeben, mit welcher Wahrscheinlichkeit die einzel- 


© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 47 
T. Cleff, Angewandte Induktive Statistik und Statistische Testverfahren, 
https://doi.org/10.1007/978-3-8349-6973-6_4 


® 


Check for 
updates 


a 


48 4  Zufallsvariablen und Wahrscheinlichkeitsverteilungen 





- 1.0 

zZ Wahscheinlichkeitsfunktion 

= 08 

= 

= 0.6 

.S 

3 0.4 

2 1/6 1/6 1/6 1/6 1/6 1/6 
= 0.2 

= 0.0 

1 2 3 4 5 6 
Augenzahl 


Verteilungsfunktion 





Verteilungsfunktion F(x) 


Augenzahl 


Abb. 4.1 Wahrscheinlichkeitsfunktion und Verteilungsfunktion bei einem Würfelexperiment 


nen Werte oder Wertintervalle bei den Zufallsexperimenten eintreten. In beiden Fällen 
lassen sich zudem die Wahrscheinlichkeitsverteilungen durch eine Wahrscheinlichkeits- 
funktion (engl.: probability function) und durch eine Verteilungsfunktion (engl.: distribu- 
tion function) darstellen. Für die diskrete Zufallsvariable eines Würfelexperiments sind 
die Wahrscheinlichkeitsfunktion und Verteilungsfunktion in Abb. 4.1 dargestellt. 

Wie bei der diskreten Häufigkeitsverteilung lässt sich auch für die diskrete Wahrschein- 
lichkeitsverteilung so etwas wıe ein Mittelwert und eine Varianz berechnen. Beim Mittel- 
wert spricht man in Bezug auf eine Zufallsvariable von einem Erwartungswert (engl.: 
expected value), der sich durch Addition aller Werte einer Zufallsvariablen gewichtet mit 
den Werten zugehörigen Wahrscheinlichkeiten berechnet. Für das Würfelexperiment aus 
Abb. 4.1 ergibt sich für den Erwartungswert: 


N 6 
l 
E(X) = ux = ),.%-P(&,)) — 2a 
= = 


he Ed eier a ee (4.1) 
6 6 6 6 6 6 
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Für die Varianz ergibt sich: 


N 
=) PR)=A-39 240-394... +6-3,9°- 
=] 


I 
=,2,9166, 

(4.2) 
Theoretisch gibt es zahlreiche unterschiedliche empirische Wahrscheinlichkeitsverteilun- 
gen, die sich aus Beobachtungen von relativen Häufigkeitsverteilungen aus der Realität 
ergeben. So unterscheiden sich sicher die Wahrscheinlichkeitsverteilungen der Zufalls- 
variablen X = {Anzahl der Kunden in einem Geschäft} von der Zufallsvariablen Y = 
{Haltbarkeitsdauer von einem Jogurt!}. 

Viele dieser empirischen Verteilungen lassen sich aber modellhaft durch eine begrenz- 
te Anzahl theoretischer Wahrscheinlichkeitsfunktionen approximieren, sodass einige von 
diesen theoretischen Wahrscheinlichkeitsfunktionen eine besondere Bedeutung für die 
(wissenschaftliche) Praxis erlangt haben. 

Die einfachste Form ist beispielsweise die in Abb. 4.1 dargestellte diskrete Gleich- 
verteilung (engl.: uniform probability distribution), bei der jedes abzählbare Ereignis die 
gleiche Wahrscheinlichkeit aufweist. Darüber hinaus haben weitere theoretische Vertei- 
lungen Berühmtheit erlangt, um typische diskrete Phänomene in der betriebswirtschaftli- 
chen Praxis zu beschreiben. Dazu gehören die Binomialverteilung, die hypergeometrische 
Verteilung und die Poisson-Verteilung, die alle im Folgenden kurz vorgestellt werden 
sollen. 


4.1 Diskrete Verteilungen 
4.1.1 Binomialverteilung 


Eine der wichtigsten diskreten Verteilungen ist die sogenannte Binomialverteilung (engl.: 
binomial distribution). Etymologisch leitet sich der Begriff Binomial aus dem lateini- 
schen für Ex binis nominibus ab, was übersetzt „aus zwei Ausdrücken bestehend‘ bedeu- 
tet. Eine Binomialverteilung ist dadurch gekennzeichnet, dass sie nur zwei verschiedene 
Merkmalsausprägungen (A und B) aufweist, die zusammen den gesamten Wahrschein- 
lichkeitsraum ausfüllen: AU B = 2. Die beiden Ereignisse sind dabei unabhängig 
voneinander und die Einzelwahrscheinlichkeiten ergeben aufaddiert den Wert Eins. Zu- 
nächst erscheint die Begrenzung auf lediglich zwei Merkmalsausprägungen aus Sicht der 
Praxisrelevanz sehr einschränkend. Sicher gibt es typische Variablen — wie zum Beispiel 
der Kauf oder Nichtkauf eines Produkts — mit nur zwei Ausprägungen. Aber auch darüber 
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hinaus interessieren immer wieder binomiale Fragestellungen, die auf ein Eintreten (A) 
oder Nicht-Eintreten (B) eines Ereignisses zielen: 


Mit welcher Wahrscheinlichkeit fällt eine Maschine aus oder nicht, 
mit welcher Wahrscheinlichkeit ist ein Arbeitnehmer krank oder gesund, 
mit welcher Wahrscheinlichkeit fällt ein Kredit aus oder nicht und 


mit welcher Wahrscheinlichkeit nımmt ein Kunde eine bestimmte Werbung wahr oder 
nicht, etc. 


Alle diese Fragestellungen besitzen eine hohe betriebswirtschaftliche Relevanz, obwohl 
sie die Wahrscheinlichkeit für eine Variable mit lediglich zwei möglichen Ausprägungen 
untersuchen. 

In der Theorie wird zur Beschreibung der Binomialverteilung häufig das sogenannte 
„Urnenmodell“ verwendet. Hierzu stelle man sich z. B. eine Urne mit zehn schwarzen und 
fünf weißen Kugeln vor, aus der nacheinander Kugeln mit Zurücklegen gezogen werden. 
Wiederum bestehen also zwei mögliche Ausprägungen des Zufallsexperiments: Es wird 
entweder eine weiße Kugel gezogen oder eine schwarze. Die Wahrscheinlichkeit, aus die- 
ser Urne eine weiße Kugel zu ziehen, beträgt p = P(Kugel = weiß) = 5/15 = 1/3. Die 
Wahrscheinlichkeit für die schwarzen Kugeln ergibt sich aus dem Rest, in diesem Fall: 
q = P(Kugel = schwarz) = 1 - 1/3 = 2/3. Sofort wird deutlich, dass man eigentlich 
nur einen der beiden Wahrscheinlichkeitswerte — den Wert p — kennen muss, da sich die 
zweite Wahrscheinlichkeit als komplementäre Größe zwangsläufig ergibt (qg = (1 — p)). 
Da bei der Binomialverteilung die Ziehungen als unabhängig voneinander angenommen 
werden, dürfen sich die Ziehungswahrscheinlichkeiten bei einer zweiten Ziehung nicht 
ändern: Nach wie vor muss die Ziehungswahrscheinlichkeit einer weißen Kugel 1/3 und 
die einer schwarzen Kugel 2/3 betragen. Dies ist allerdings nur dann der Fall, wenn nach 
wie vor von insgesamt 15 Kugeln fünf Kugeln weiß und 10 Kugeln schwarz sind. Deshalb 
muss nach jeder Ziehung die Kugel wieder zurückgelegt werden. 

Häufig wird die Binomialverteilung deshalb mit dem Modell „Ziehen mit Zurückle- 
gen‘ verbunden, was im Urnenmodell zwar richtig ıst, pauschal aber nicht immer gelten 
muss. Besser sollte mit der Binomialverteilung das Modell „Ziehen mit gleichbleibenden 
Ziehungswahrscheinlichkeiten“ assoziiert werden. 

Wie groß ist nun die Wahrscheinlichkeit, im Urnenmodell bei insgesamt fünf Zie- 
hungen mit gleichbleibender Ziehungswahrscheinlichkeit zwei weiße und drei schwarze 
Kugeln zu ziehen? Betrachten wir zunächst eine bestimmte Ziehungsreihenfolge, nämlich 
weiß, weiß, schwarz, schwarz, schwarz. Die Wahrscheinlichkeit für genau diese Reihen- 
folge beträgt: 


P (weiß) - P(weiß) - P(schwarz) - P(schwarz) - P(schwarz) = P(weiß)” - P(schwarz)” 
(4.3) 
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Abb. 4.2 Binomialverteilung B(n,k,p)= n (1 nk_n!  « pe 
u k kU(n-k)! 


| 


Anzahl der Ziehungen insgesamt. 


aan für das Auftreten eines Ereignisses mit einer bestimmten 
Eigenschaft (z.B. Wahrscheinlichkeit des Auftretens einer weißen Kugel). 


Anzahl der Ergebnisse mit einer bestimmten Eigenschaft (z.B. Anzahl der 
gezogenen weißen Kugeln). 


oder verkürzt geschrieben: 


IN - n% 
D=(l=p) = (5) ( _ ;) — 3,29%. (4.4) 


Nun kommt das Ereignis zweier weißer und dreier schwarzer Kugeln durchaus auch in an- 
deren Reihenfolgen vor, z. B. abwechselnd schwarze und weiße Kugeln. Auch hier ergibt 
sich die gleiche Einzelwahrscheinlichkeit: 


2 3 
P (schwarz) - P (weiß) - P (schwarz) - P(weiß) - P (schwarz) = (5) ( _ ;) 


=3293%0. 
(4.5) 
Aus der Kombinatorik lässt sich die Anzahl möglicher Kombinationen zweier weißer und 
dreier schwarzer Kugeln mit Hilfe des Binomialkoeffizienten berechnen: 


5 5! 1-2-.3-.4-5 
= — = [0 (4.6) 
2 215-2)! (-2)(1-2-3) 
Dieser Binomialkoeffizient ergibt somit insgesamt zehn Möglichkeiten für die Kombina- 
tion für die Ziehung zweier weißer und dreier schwarzer Kugeln, wenn jede Kugel nach 
der Ziehung zurückgelegt wird. Somit lässt sich nun auch die Gesamtwahrscheinlichkeit 


für eine von der Reihenfolge unabhängige Ziehung der Kombination zweier weißer und 
dreier schwarzer Kugeln bestimmen, nämlich: 


5\ (1\ (2\° 5! Dei or 78 7 
Ye 


= 10:3 29% = 32,9%: 


(4.7) 

Unabhängig von diesem spezifischen Beispiel gilt also für die Formel der Binomialvertei- 
lung (vgl. Abb. 4.2). 

Nähern wir uns der Binomialverteilung nochmals mit Hilfe eines weiteren Beispiels: 

Ein Unternehmen lässt an drei verschiedenen Tagen einer Woche eine TV-Werbung aus- 

strahlen. Die Werbeverantwortlichen haben mit Hilfe von Media-Analysen ermittelt, dass 
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0.8 

0.7 

0.6 Binomialverteilung mit der Augenzahl x=6 bei n=2 Würfen mit einem fairen Würfel 
U8e 

24 m Binomialverteilung mit der Augenzahl x=6 bei n=15 Würfen mit einem fairen Würfel 


Wahrscheinlichkeit (P(x)) 
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Anzahl mit der Augenzahl x=6 


Abb. 4.3 Binomialverteilung mit der Augenzahl x = 6 bein Würfen mit einem fairen Würfel 


die potenziellen Kunden jede einzelne Werbung mit einer gleichbleibenden Wahrschein- 
lichkeit von 10 Prozent zu sehen bekommt. Wie groß ist die Wahrscheinlichkeit, dass ein 
Kunde zwei Werbekontakte hat, wenn die Kontaktreihenfolge keine Rolle spielt? 

Die Wahrscheinlichkeit, dass ein Kunde eine Werbung zu sehen bekommt, ıst also 
p = 0,1, die Komplementärwahrscheinlichkeit, die Werbung nicht gesehen zu haben, 
ist demnach g = (1 - p) = (1-01) = 0,9. Diese Wahrscheinlichkeiten ändern sich 
ım Verlauf der Zeit nicht, sodass die Wahrscheinlichkeiten binomialverteilt sind. An die- 
sem Beispiel wird deutlich, weshalb man bei der Binomialverteilung nicht pauschal vom 
Modell „Ziehungen mit Zurücklegen“ sprechen sollte: Wenn beispielsweise eine Person 
die Werbung am Montag nicht gesehen hat, wird sie im weiteren Verlauf der Woche nicht 
mehr die Möglichkeit haben, diese Montagswerbung nochmals zu sehen. Die Montags- 
werbung ist verstrichen und wird auch „in dieser Woche nicht mehr zurückgelegt“! Da 
sich die Wahrscheinlichkeit für die anderen beiden Werbekontakte nicht ändert, liegt eine 
Binomialverteilung vor. Die Wahrscheinlichkeit für zwei Werbekontakte ist 


n! 3! 


3 
B(3;2;0,1) = run" = a ee oa 





.0,1°:.0,9' = 2,7%. 


(4.8) 
An dieser Stelle seien weitere Besonderheiten der Binomialverteilung kurz aufgeführt: 


e Liest der Wert für p bei p = 0,5, ist die Binomialverteilung symmetrisch, unabhängig 
von der Größe n der Stichprobe. In den Fällen, in denen der Wert p < 0,5 (p > 0,5) 
ist, ist die Binomialverteilung rechtsschief (linksschief). Mit zunehmender Stichpro- 
bengröße n nimmt die Schiefe der Verteilung allerdings ab (vgl. Abb. 4.3). 
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Anzahl der Erfolge in einer Versuchsreihe. 





Funkticenargumene 
a Anzahl der unabhängigen Versuche. 
Zah Erioige & Bi = 2 
Versuche > Du] = 3 Wahrscheinlichkeit eines Erfolgs für jeden Versuch (p). 
GE = 7 F = : Kumuliert=WAHR=1 gibt Verteilungsfunktion an. 
STR = Kumuliert=FALSCHS=0 gibt Wahrscheinlichkeitsfunktion an. 
ab Wahrheiten Susann Turoch, Ergebnis. 
Kursalkart ii der ehren, der den Tjg der Punktion beiten 
Hi Tür des Funkiign OK | Abbıechen 


Syntax: BINOM.VERT(Zahl_Erfolge; Versuche; Erfolgswahrscheinlichkeit; Kumuliert); BINOM.VERT(2;3;0,1; 0) 


Abb. 4.4 Berechnung der Binomialverteilung mit Excel 


e Der Erwartungswert einer binomialverteilten Zufallsvariable ist E(X) = n - p. Für das 
Beispiel der Werbekontakte ergibt sich E(X) = 3: 0,1 = 0,3. D.h., man erwartet bei 
dreimaligem Ziehen durchschnittlich insgesamt 0,3 Werbekontakte. 

e Die Varianz einer binomialverteilten Zufallsvariable ist Var(X) =n:- p- (1 — p). Für 
das Beispiel der Werbekontakte ergibt sich Var(X) = 3: 0,1: 0,9 = 0,27. 

e Binomialverteilte Zufallsvariablen sind reproduktiv, d.h., das Zusammenführen zweier 
(oder mehrerer) binomialverteilter Zufallsvariablen führt wiederum zu einer binomial- 
verteilten Zufallsvariablen. 

e Unter bestimmten Voraussetzungen kann die Wahrscheinlichkeit binomialverteilter Zu- 
fallsvarıiablen auch mit Hilfe anderer Verteilungen berechnet werden. Binomialverteilte 
Zufallsvariablen sind annähernd (approximativ).... 

a. ... normalverteilt (N(n - p; yn- p(l — p))), wennn- p-(1l—- p) > 9 silt (vgl. 
beispielsweise Abb. 4.3), 
b. ... Poisson-verteilt (Po(n - p)), wennn- p < 10 undn > 1500- p silt. 


4.1.1.1 Berechnung der Binomialverteilung mit Excel 

Softwaretechnisch können die Wahrscheinlichkeitswerte der Binomialverteilung mit 
Hilfe von Excel wie folgt berechnet werden: Unter den Menüpunkten Formeln und 
danach Funktionen Einfügen muss aus der Funktionskategorie Statistik die Funktion B/- 
NOM.VERT gewählt werden. Es müssen dann — wie aus Abb. 4.4 ersichtlich - lediglich 
die Parameter Anzahl der Erfolge in einer Versuchsreihe (Zahl_Erfolge), Anzahl der 
voneinander unabhängigen Versuche (Versuche), Wahrscheinlichkeit eines Erfolgs für 
jeden Versuch (Erfolgswahr) und der Wahrheitswert, der den Typ der Funktion bestimmt, 
(Kumuliert)' angegeben werden. 


4.1.1.2 Berechnung der Binomialverteilung mit Stata 
In Stata erfolgt die Berechnung mit Hilfe der Syntax aus Abb. 4.5. Dabei wird in die 
Befehlszeile display binomialp(n,k,p) eingegeben, wenn die Wahrscheinlichkeit für k er- 


! I für BINOM.VERT gibt die Verteilungsfunktion zurück und 0 für BINOM.VERT gibt die Wahr- 
scheinlichkeitsfunktion zurück. 


54 4  Zufallsvariablen und Wahrscheinlichkeitsverteilungen 


Berechnet die Wahrscheinlichkeit für k erfolgreiche Realisationen | display binomialp(n,k,p) 
aus n Versuchen für die Erfolgswahrscheinlichkeit p: B(n,k=x,p). 


Bsp.: Wahrscheinlichkeit für 2 erfolgreiche Realisationen aus 3 display binomialp(3,2,0.1) 
Versuchen für die Erfolgswahrscheinlichkeit p=0,1: B(3,k=2,0.1). .027 


Berechnet die Wahrscheinlichkeit für höchstens k erfolgreiche display binomial(n,k,p) 
Realisationen aus n Versuchen für die Erfolgswahrscheinlichkeit 
p: B(n,kx,p). 


Bsp.: Wahrscheinlichkeit für höchstens 2 erfolgreiche Realisatio- display binomial(3,2,0.1) 
nen aus 3 Versuchen für die Erfolgswahrscheinlichkeit p=0,1: 999 
B(3,k<2,0.1). 


Berechnet die Wahrscheinlichkeit für mindestens k erfolgreiche display binomialtail(n,k,p) 
Realisationen aus n Versuchen für die Erfolgswahrscheinlichkeit 
p: B(n,k2x,p). 


Bsp.: Wahrscheinlichkeit für mindestens 2 erfolgreiche Realisatio- | display binomial- 
nen aus 3 Versuchen für die Erfolgswahrscheinlichkeit p=0,1: tail(3,2,0.1) 
B(3,k22,0.1). .028 





Abb. 4.5 Berechnung der Binomialverteilung mit Stata 


folgreiche Realisationen aus n Versuchen für die Einzelwahrscheinlichkeit p berechnet 
werden soll (B(n,k, p)). Analog erfolgt die Berechnung des Wertes der binomialver- 
teilten Verteilungsfunktion für höchstens k erfolgreiche Realisationen durch display bi- 
nomial(n,k,p) und für mindestens k erfolgreiche Realisationen durch display binomial- 
tail(n,k,p).” 


4.1.2 _ Hypergeometrische Verteilung 


Eine hypergeometrische Verteilung (engl.: hypergeometric distribution) ist dadurch ge- 
kennzeichnet, dass sie — wie die Binomialverteilung — nur zwei verschiedene Merkmals- 
ausprägungen (A und B) aufweist, die zusammen wiederum den gesamten Wahrschein- 
lichkeitsraum ausfüllen: AU B = 2. Im Gegensatz zur Binomialverteilung ist bei der 
hypergeometrischen Verteilung die Wahrscheinlichkeit des Auftretens eines Ereignisses 
abhängig von den Ergebnissen der bereits durchgeführten Experimente. Die Ziehungs- 
wahrscheinlichkeit bleibt während der einzelnen Ziehungen nicht konstant. 


*Eine sehr gute Darstellung über die Vorgehensweise bei Stata findet sich hier: https://www. 
youtube.com/watch?v=40641mAAT_I. 
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Bemühen wir zur Erklärung der hypergeometrischen Verteilung wieder das Urnen- 
modell mit Kugeln zweier unterschiedlicher Farben und stellen uns eine Urne mit fünf 
roten und drei grünen Kugeln vor. Im ersten Zug beträgt die Wahrscheinlichkeit eine 
rote Kugel zu ziehen P(Kugel = rot) = 5/8. Die Wahrscheinlichkeit für die grünen 
Kugeln ergibt sich wiederum aus der Komplementärwahrscheinlichkeit, in diesem Fall: 
P(Kugel = grün) = 1 —- 5/8 = 3/8. Nun wird die gezogene Kugel nicht zurückgelegt, 
sodass nur noch sieben Kugeln in der Urne verbleiben. Die Ziehungswahrscheinlichkeiten 
für eine weitere rote oder eine weitere grüne Kugel sind abhängig davon, welche Farbe 
die Kugel hatte, die im ersten Versuch gezogen wurde: Wurde bei der ersten Ziehung ei- 
ne rote Kugel gezogen, sind vier der verbleibenden sieben Kugeln rot, sodass die roten 
Kugeln eine Ziehungswahrscheinlichkeit von P (Kugel = rot) = 4/7 und die grünen 
Kugel eine Ziehungswahrscheinlichkeit von P(Kugel = grün) = 3/7 haben. Wurde 
hingegen bei der ersten Ziehung eine grüne Kugel gezogen, sind fünf der sieben ver- 
bleibenden Kugeln rot, sodass die roten Kugeln eine Ziehungswahrscheinlichkeit von 
P»(Kugel = rot) = 5/7 und die grünen Kugel eine Ziehungswahrscheinlichkeit von 
P»(Kugel = grün) = 2/7 haben. Man erkennt deutlich die Abhängigkeit der Ziehungs- 
wahrscheinlichkeit von den Ergebnissen vorangegangener Ziehungen. 

Wie groß ist nun die Wahrscheinlichkeit, im Urnenmodell bei insgesamt zwei abhän- 
gigen Ziehungen - also ohne Zurücklegen - eine rote und eine grüne Kugel zu ziehen? 
Hierzu müssen drei Fragen beantwortet werden: 


e Wie groß ist die gesamte Anzahl aller gleichwertigen Ziehungsmöglichkeiten für ei- 
ne Ziehungskombination rot/grün unabhängig von der Ziehungsreihenfolge? Aus der 
Kombinatorik ergeben sich hierfür insgesamt 


N 8 8! 
— = ——— = 28 Möglichkeiten. 
n 2 218 — 2)! 


e Wie groß ist die gesamte Anzahl aller einmaligen Ziehungen von einer aus fünf roten 
Kugeln, wiederum unabhängig davon, ob diese im ersten oder zweiten Versuch gezo- 
gen wird? Aus der Kombinatorik ergeben sich hierfür insgesamt 


M 5 5! en 
— = —— —— = 5 Möglichkeiten. 
X l 115-1)! 


e Die Anzahl aller einmaligen Ziehungen von einer aus drei grünen Kugeln ergibt sich 
aus der komplementären Summe 


N-—-M 8—5 3 3! 
n—XxX 2-1 1 1!3-1)! 
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Abb. 4.6 Hypergeometrische Anzahl allern-x Anzahl aller x 
5 grünen Möglichkeiten roten Möglichkeiten 
Verteilung 
n-X X 
H(N,M,n,x) = z 
Anzahl aller a N 
Anzahl der Menge mit 
bestimmter Eigenschaft (rot) 
in der Grundgesamtheit. Anzahl aller Möglichkeiten 
Anzahl Ziehungen. 


Anzahl der Realisationen mit bestimmter 
Eigenschaft (rot). 


Die Wahrscheinlichkeit, bei zwei abhängigen Ziehungen eine rote und eine grüne Kugeln 
zu ziehen, ergibt sich somit aus dem Quotienten: 


H@5.2.1) = (Anzahl 1 x ROT zu ziehen) - (Anzahl 1 x GRÜN zu ziehen) (4.9) 
nn Gesamtanzahl aller Ziehungsmöglichkeiten 
M\ (N-M 5\ (8-5 5! 3! 
T16-N1 ' TIG-ND! Sn 
H(8, 3), 1) ne (5) Gm ) — () 6) — 1165 I EG I)! u a 0.54 — 54 9%. 
(„) (5) IB) 28 
(4.10) 


Hieraus lässt sich für die hypergeometrische Verteilung der in Abb. 4.6 dargestellte for- 
male Zusammenhang formulieren. 

Ein typisches Beispiel für eine hypergeometrische Verteilung ist das Ziehen von Lot- 
tozahlen. Wie groß ıst die Wahrscheinlichkeit, bei 6 aus 49 drei bzw. sechs Richtige zu 
haben? Da das Ziehen der Lottokugeln ohne Zurücklegen erfolgt, ändert sich mit jeder 
Ziehung zwangsläufig die Ziehungswahrscheinlichkeit jeder Kugel. Für drei bzw. sechs 
richtige Zahlen ergeben sich folgende Wahrscheinlichkeiten: 


(3) (3) ss y1 en 12.341 - 20 








ee u 13983816 a 
(4.11) 
GO _ Ta mn 11 
H(49,6,6,6)= 5, = og = aogsgrg = 000000715 %. 
(5) ao)! 13.983.816 
(4.12) 


Weitere Eigenschaften der hypergeometrischen Verteilung sind: 
Erstens: Der Erwartungswert einer hypergeometrisch verteilten Zufallsvariablen ist de- 
finiert als 


E(X) = 2 A.13 
An (4.13) 
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Für fünf rote Kugeln ergäbe sich bei zwei Ziehungen demnach ein Erwartungswert von 


5 
E(X) =2- 7 1,25 für die Anzahl der gezogenen roten Kugeln. (4.14) 


Zweitens: Die Varianz einer hypergeometrisch verteilten Zufallsvariablen ist definiert 


durch 
n(N—-n) M j M 
N-1 N N) 


sodass sich für das obige Kugelbeispiel folgende Varianz ergibt: 


a mt-7)-53 505) 00 (4.16) 
N-] N N 8 


Var(X) = (4.15) 


Var(X) = S_1 5 
Drittens: Die Wahrscheinlichkeit hypergeometrisch verteilter Zufallsvariablen kann unter 
bestimmten Voraussetzungen auch durch andere Verteilungen approximiert werden. Dies 
ist insbesondere bei großen Grundgesamtheiten der Fall, denn hier verändern sich trotz 
Nicht-Zurücklegens die Wahrscheinlichkeiten in den folgenden Ziehungen kaum. Man 
mache es sich am Beispiel der Befragung der deutschen Bevölkerung von rund 80 Mio. 
Bürgern klar. Die Ziehungswahrscheinlichkeit ist bei der ersten Ziehung 1/80.000.000. 
Bei der zweiten Ziehung ist die Ziehungswahrscheinlichkeit der restlichen Einwohner mit 
1/79.999.999 nur geringfügig kleiner. Hypergeometrisch (H(N, M,n,x))-verteilte Zu- 
fallsvariablen sind annähernd (approximativ).... 








M n-(N—-n) M 
. normalverteilt IN | n — ; ,|—— : — - [1 
N N-] N 
u 
E(x) 


M 
wenn n > 30 und 0,1] < N < 0,9 silt, 


M 
. Poisson-verteilt I Po en: , 


u — 
E(&) 


M M n 
wenn 0,1 > — oder — > 0,9 und n > 30 und — < 0,05 silt, 
N N N 


M 
. binomialverteilt (? (" 7)) ; 


M 
wenn n > 10 und 0,1 < - < 0,9 und = < 0,05 gilt. 


4.1.2.1 Berechnung der hypergeometrischen Verteilung mit Excel 

Softwaretechnisch können die Wahrscheinlichkeitswerte einer hypergeometrischen Vertei- 
lung mit Hilfe von Excel berechnet werden: Unter den Menüpunkten Formeln — Funktio- 
nen Einfügen muss aus der Funktionskategorie Statistik die Funktion HYPERGEOM.VERT 
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Anzahl (x) der in der Stichprobe erzielten Erfolge mit der 














BEE bestimmten Eigenschaft (Anzahl gezogener roter Kugeln). 
Erioge | Bi] =» Anzahl der Ziehungen (n). 
De s = n ? s Anzahl (M) der in der Grundgesamtheit möglichen Erfolge 
NE, zZ. mit einer bestimmten Eigenschaft (Anzahl der roten Kugeln 
Kult Eu = FA in der Urne). 





= BSR Umfang (Größe) der Grundgesamtheit (N). 


CR \ahrscheinkchkeden einer npergeometrech-werteilen Dufallssansblen zuric. 
Kumuliert=WAHR=1: gibt Verteilungsfunktion an. 
Kumuliert=FALSCH=0: gibt Wahrscheinlichkeitsfunktion an. 


Ergebnis. 





Kuala di nee: Fur ce ur 
Wishrscheinkchloptee char BALSH 


einsparen WAlee; Par de | 






Fermelergelras 133714785 


BAHT führ dire Funken — Alörochen 
Syntax: HYPGEOM.VERT(Erfolge_S;Umfang_S;Erfolge_G;Umfang_G); HYPGEOM.VERT(1;2;5;8) 





Abb. 4.7 Berechnung der hypergeometrischen Verteilung mit Excel 


gewählt werden. Danach müssen — wie aus Abb. 4.7 ersichtlich — die Parameter für x 
(Anzahl der in der Stichprobe erzielten Erfolge mit der bestimmten Eigenschaft: Erfol- 
ge_S), für n (Größe der Stichprobe: Umfang_S), für M (Anzahl der in der Grundgesamt- 
heit möglichen Erfolge mit einer bestimmten Eigenschaft: Erfolge_G) und N (Größe der 
Grundgesamtheit: Umfang_G) angegeben werden. 


4.1.2.2 Berechnung der hypergeometrischen Verteilung mit Stata 

In Stata erfolgt die Berechnung wiederum mit Hilfe der Syntaxeingabe (vgl. Abb. 4.8). 
Möchte man die hypergeometrische Wahrscheinlichkeit für x = k erfolgreiche Reali- 
sationen eines interessierenden Merkmals einer Stichprobe im Umfang von n berechnen 
und in der Grundgesamtheit der Größe N ist das interessierende Merkmal insgesamt M 


Berechnet die Wahrscheinlichkeit für k erfolgreiche Realisatio- display hypergeometricp(N,M,n;x) 
nen ausn Versuchen: H(N,M,n,x=k). 


Bsp.: Wahrscheinlichkeit für eine erfolgreiche Realisation aus display hypergeometricp(8,5,2,1) 
zwei Versuchen: H(8,5,2,x=1). 536 


Berechnet die Wahrscheinlichkeit für höchstens k erfolgreiche display hypergeometric(N,M,n,x) 
Realisationen aus n Versuchen: H(N,M,n,x<k). 


Bsp.: Wahrscheinlichkeit für höchstens eine erfolgreiche Realisa- | display hypergeometric(8,5,2,1) 
tion aus zwei Versuchen: H(8,5,2,x<1). .643 


Berechnet die Wahrscheinlichkeit für mehr als k erfolgreiche display 1- 
Realisationen aus n Versuchen: H(N,M,n,x>k). hypergeometric(N,M,n,x) 


Bsp.: Wahrscheinlichkeit für mindestens 2 erfolgreiche Realisa- display 1-hypergeometric(8,5,2,1) 
tionen aus 3 Versuchen: H(8,5,2,x>1). 397 





Abb. 4.8 Berechnung der hypergeometrischen Verteilung mit Stata 
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mal vertreten, ist in die Befehlszeile display hypergeometricp(N,M,n,x) mit den entspre- 
chenden Werten für N, M,n undx = k einzugeben. Analog erfolgt die Berechnung 
des Wertes der hypergeometrischen Verteilungsfunktion (N, M,n,x) für höchstens k 
erfolgreiche Realisation (x < k) durch display hypergeometric(N,M,n,k) und für mehr als 
k (x > k) erfolgreiche Realisation durch display I-hypergeometric(N,M,n,k). 


4.1.3 Poisson-Verteilung 


Auch die nun zuletzt noch vorzustellende diskrete Verteilung ist letztlich auf die Binomi- 
alverteilung zurückzuführen, denn es geht wiederum um das Eintreten oder Nichteintreten 
eines bestimmten Ereignisses (Bernoulli-Experiment). Die nach dem französischen Phy- 
siker und Mathematiker Sim&on Denis Poisson (1781-1840) benannte Poisson-Verteilung 
(engl.: poisson distribution) wird dabei gerne dann verwendet, wenn es um die Schätzung 
des Auftretens eines bestimmten Ereignisses innerhalb eines bestimmten Zeitintervalls 
geht, wie z.B. die Anzahl der Maschinenausfälle oder fehlerhafter Produkte innerhalb 
eines Tages oder die Anzahl von Abverkäufen eines Fahrzeuges in einer Stunde etc. Es 
wird dabei unterstellt, dass die Ereignisse unabhängig voneinander sind, sodass die Wahr- 
scheinlichkeit eines Maschinenausfalls im ersten Zeitintervall nicht in Zusammenhang mit 
der Ausfallwahrscheinlichkeit im zweiten Intervall steht. 

Eine Variable ist in der Regel dann Poisson-verteilt, wenn die Wahrscheinlichkeit des 
Eintretens eines bestimmten Ereignisses relativ gering ist. Der Parameter p der Binomi- 
alverteilung ist in diesem Fall vergleichsweise klein, während der Parameter n - also der 
Umfang der Stichprobe - tendenziell groß ist. In einem solchen Fall kann bewiesen wer- 
den, dass eine binomialverteilte Zufallsvariable einer bestimmten Formel folgt: 


n—x x! 


Bn,k=x,p)-= lin ro - p"" = oh, (4.17) 
n>o \x 


Dieser Ausdruck entspricht der Formel zur Berechnung Poisson-verteilter Zufallsvaria- 
blen (vgl. Abb. 4.9). 

Eine Besonderheit der Poisson-Verteilung ist, dass die Verteilung mit nur einem 
Parameter A beschrieben werden kann und der Erwartungswert u und die Varianz der 


Po(A,x) [a | 


x! 
m der Beobachtungen eines bestimmten Ereignisses in einem gegebenen 


Intervall (Zeitraum). 


Erwartungswert und Varianz der Poisson-Verteilung. 


Abb. 4.9 Poisson-Verteilung 
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Verteilung genau diesem Parameter A entsprechen: 
P)emen =, (4.18) 


Eine weitere Besonderheit der Poisson-Verteilung ist die der Reproduktivität, bei der die 
Summe von n stochastisch unabhängigen und Poisson-verteilten Zufallsvariablen mit den 
Parametern A|, A», ..., Anwieder eine Poisson-Verteilung mitX = Aı +A2 +... + An 
ergibt. Anhand eines Beispiels sollen beide Besonderheiten gezeigt werden: 

Auf eine Kreuzung münden vier Straßen. Die Anzahl der Kfz, die aus den einzelnen 
Straßen kommen, sind stochastisch unabhängig und Poisson-verteilt. Aus Erfahrung weiß 
man, dass aus den vier Straßen täglich im Durchschnitt jeweils 2,0; 1,6; 3,4 und 3,0 Kfz 
kommen. Wie groß ist die Wahrscheinlichkeit, dass täglich genau neun Kfz die Kreuzung 
passieren und wie groß ist die Wahrscheinlichkeit, dass täglich höchstens neun Kfz die 
Kreuzung passieren? 

Die Erwartungswerte der Poisson-Verteilungen entsprechen den jeweiligen Parametern 
für uı = Aı = 2,..., ua = Ay = 3,4. Aufgrund der Reproduktivität ergibt die Summe 
der einzelnen Poisson-Verteilungen wieder eine Poisson-Verteilung, sodass wir täglich 
durchschnittlich insgesamt 


KM = Uiırla+ls+ıl4 =2+16+34+3=10 = A (4.19) 


Kfz erwarten können. Für die Wahrscheinlichkeit, dass täglich genau neun Kfz die Kreu- 
zung passieren, ergibt sich: 
x 9 

PoA,x=9) = ee _ pe” = 12,511%. (4.20) 
Zur Berechnung der Wahrscheinlichkeit für täglich höchstens neun die Kreuzung pas- 
sıerende Kfz müssten die Einzelwahrscheinlichkeiten für die Fälle zwischen keinem und 
neun Kfz berechnet und aufaddiert werden. Hierbei hilft die Berechnung mit dem Com- 
puter. 

Oben wurde gezeigt, dass sich die Poisson-Verteilung mit A = n - p aus der Binomi- 
alverteilung herleitet und letztere wiederum durch die stetige Normalverteilung approxi- 
miert werden kann. Unter bestimmten Umständen (A > 10) kann deshalb die Poisson- 
Verteilung ebenfalls durch die stetige Normalverteilung approximiert werden.” 


> Bei Approximation einer diskreten Verteilung durch eine stetige Verteilung ist die Wahrschein- 
lichkeit für einen bestimmten Wert x; der Zufallsvariablen im diskreten Fall positiv, während sie bei 
der stetigen Verteilung gleich Null ist. Um durch Approximation z.B. den Wert für P(X = 10) zu 
bestimmen, berechnet man die Differenz der normalverteilten Verteilungsfunktionen P(X = 10) = 
P(X < 10,5) -P(X <95). 
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Parameter A (Erwartungswert). 
Parameter Gesuchte Anzahl. 
| “ a Funktiorsargumente F nn 


| FIESEOHVERT 












Furktiorsargumeribe 
| POBSSOHLVERT 
x 8 | = 3 


Mittehmort 10 3£] = ı0 


H # 


Metelen 10 10 


ER 


Kumulert 0 | = Falsch Kumußort 1 m AH 









= er 
Gib Wahrschwinächkoiten ann Poisson-Wmrbeiken Zulalkwariablen Zunacke (Die verwendete Gleichung bit in der 
Hilfe genaue beiehrie®en.). 


= DL1F511K08 
Gi Wahrschwinichkeiten aner Poisson-werbeillen Zufslksvarlablen zundc. (Die verwendete Gleichung ist in cher 
Hilfe genaue beiehrieken. ]. 


Kummer Fe der Wahrheitzwert, der des Typ der Funken besibrnmt Kumukort te der Walreizwert, der den Tip der Funkbon berbrrert. 


Formelergebeis = 0.1251. 10055 


His Wr db Funken | Ök Alb echsn 


Mit einer Wahrscheinlichkeit von 12,51% 
passieren täglich durchschnittlich genau neun 


Formeiergebnis = 0AS7029704 


HE (ie casa Fundiliee Le] Abtınschsan | 


Mit einer Wahrscheinlichkeit von 45,79% 
passieren täglich durchschnittlich höchstens 


KFZ die Kreuzung. neun KFZ die Kreuzung. 
Wahrscheinlichkeitsverteilung für genau Verteilungsfunktion für höchstens 
X=9 KFZ. X=9 KFZ. 


Syntax: POISSON.VERT(x;Mittelwert;Kumuliert); POISSON.VERT(9;10;0) 


Abb. 4.10 Berechnung der Poisson-Verteilung mit Excel 


4.1.3.1 Berechnung der Poisson-Verteilung mit Excel 

Die Wahrscheinlichkeit aus dem obigen Beispiel lässt sich mit Excel folgendermaßen 
bestimmen. Nach der Menüfolge Formeln — Funktionen Einfügen kann die Funktion 
POISSON.VERT gewählt werden. Danach müssen — wie aus Abb. 4.10 ersichtlich — die 
Parameter für die Anzahl der zu bestimmenden Fälle (X = 9), für den Mittelwert (A = 
10) und für die Art der Funktion (Kumuliert=1: POISSON.VERT gibt Verteilungsfunk- 
tion zurück; Kumuliert=0: POISSON.VERT gibt Wahrscheinlichkeitsfunktion zurück) 
angegeben werden. Für genau neun Kfz liegt die Wahrscheinlichkeit bei 12,51% (vgl. 
Abb. 4.10 links). Mit einer Wahrscheinlichkeit von 45,79 % passieren täglich durchschnitt- 
lich höchstens neun Kfz die Kreuzung (vgl. Abb. 4.10 rechts). 


4.1.3.2 Berechnung der Poisson-Verteilung mit Stata 

In Abb. 4.11 sind die Berechnungen der Wahrscheinlichkeitsverteilung und der Vertei- 
lungsfunktion mit Hilfe der Stata-Syntax zusammengefasst. Dabei wird in die Befehlszeile 
display poissonp(A,k) eingegeben, wenn die Wahrscheinlichkeit für k erfolgreiche Rea- 
lisationen mit einem Erwartungswert von X berechnet werden soll. Analog erfolgt die 
Berechnung des Wertes der Poisson-Verteilungsfunktion für höchstens k erfolgreiche Rea- 
lisationen durch display poisson(},k) und für mindestens k erfolgreiche Realisationen 
durch display poissontail(A,k).* 


*Eine sehr gute Darstellung über die Vorgehensweise bei Stata findet sich hier: https://www. 
youtube.com/watch?v=R9a61 ViJBwec. 


62 4  Zufallsvariablen und Wahrscheinlichkeitsverteilungen 


Berechnet die Wahrscheinlichkeit für x=k erfolgreiche Realisationen | display poissonp(A,k) 
bei einem Erwartungswert von u=X: Po(A,x=k). 


Bsp.: Wahrscheinlichkeit für x=9 erfolgreiche Realisationen bei display poissonp(10,9) 
einem Erwartungswert von u=10: Po(A=10, x=2). ‚125 


Berechnet die Wahrscheinlichkeit für höchstens x=k erfolgreiche display poisson(A,k) 
Realisationen bei einem Erwartungswert von u=X: Po(A,x<k). 


Bsp.: Wahrscheinlichkeit für höchstens x=9 erfolgreiche Realisatio- display poisson(10,9) 


nen bei einem Erwartungswert von u=10: Po(A=10, x=2). 458 


Berechnet die Wahrscheinlichkeit für mindestens x=k erfolgreiche display poissontail(A,k) 
Realisationen bei einem Erwartungswert von u=X: Po(A,x2k). 


Bsp.: Wahrscheinlichkeit für mindestens x=9 erfolgreiche Realisati- | display poissontail(10,9) 





onen bei einem Erwartungswert von u=10: Po(A-10, x22). .667 


Abb. 4.11 Berechnung der Poisson-Verteilung mit Stata 


4.2 Stetige Verteilungen 


Im vorhergehenden Abschnitt haben wir die Wahrscheinlichkeitsverteilungen von dis- 
kreten Zufallsvariablen kennengelernt. Mögliche Ergebnisse von diskreten Zufallsexpe- 
rımenten sind endlich viele oder abzählbar unendlich viele Werte. Können Ergebnisse 
von Zufallsexperimenten unendlich viele Werte annehmen, liegen stetige Zufallsvariablen 
vor. Häufig sind diese in Zeit-, Gewichts- oder Längeneinheiten gemessen, wie z.B. die 
Wahrscheinlichkeit für die Haltbarkeit eines Produktes. 

Während im diskreten Fall die Wahrscheinlichkeitsfunktion die Wahrscheinlichkeit für 
einen gegebenen Wert ausdrückt, erfolgt die Darstellung der stetigen Wahrscheinlich- 
keit mit Hilfe einer sog. Dichtefunktion (engl.: density function) f(x). Letztere liefert 
nicht direkt den Wahrscheinlichkeitswert, sondern dieser muss für ein gegebenes Intervall 
mit Hilfe der Integralrechnung bestimmt werden. Bei den beiden Grafiken in Abb. 4.12 
handelt es sich um typische Dichtefunktionen, da die jeweiligen Flächen unterhalb der 
Funktionen f(x) genau den Wert 


/ F%)0x == 100% (4.21) 
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b = 1,80m x 





Abb. 4.12 Dichtefunktionen 


annehmen. Die Tatsache, dass das Integral von —oo bis +00 genau den Wert | annimmt, 
ist eine notwendige Bedingung für eine Dichtefunktion.” 

Untersucht man beispielsweise die Körpergröße von Studierenden, dann liegen 100 % 
der untersuchten Studierenden unterhalb einer Kurve zwischen —oo bis +00 Körpergröße. 
Die grau schraffierte Fläche der oberen Dichtefunktion entspricht dabei der Wahrschein- 
lichkeit, dass ein Wert von höchstens 5 (in diesem Fall 1,80 m) auftritt: 


b 
Pix <b)l= / x) dx. (4.22) 


> Darüber hinaus sind notwendige Bedingungen einer Dichtefunktion, dass es sich um eine reelle 
Funktion handeln muss, die zudem nicht-negativ und integrierbar ist. 
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Die schraffierte Fläche der unteren Grafik beschreibt das Integral aller Werte die zwischen 
a (in diesem Fall: 1,50 m) und 5 (in diesem Fall 1,80 m) liegen: 


b 
rPa=x<cb= / fa)dx. (4.23) 


Analog zum Fall diskreter Zufallsvariablen erfolgen die Berechnungen für den Erwar- 
tungswert und die Varianz einer stetigen Zufallsvariablen anstelle der Addition in Form 
der Bestimmung eines Integrals. Man verwendet dabei die Werte der Dichtefunktion und 
nicht die Wahrscheinlichkeiten: 


09 


EXye ir = / x- f(x) dx (4.24) 
= / (x - ur) - fa) dx. (4.25) 


Im Folgenden wollen wir uns die wichtigsten stetigen Verteilungsfunktionen einmal ge- 
nauer ansehen. 


4.2.1 Stetige Gleichverteilung 


Die wahrscheinlich einfachste stetige Verteilung ist die sog. Gleichverteilung oder auch 
Rechteck-Verteilung (engl.: uniform distribution). Die Dichtefunktion verläuft mit einem 


konstanten Wert h 


b-a 


innerhalb eines festgelegten Intervalls zwischen dem Minimum a und dem Maximum b. 





(4.26) 


Alle Ereignisse haben dabei die gleiche Eintrittswahrscheinlichkeit. 


ee = 2202 


0 sonst 


(4.27) 


Das Integral der Dichtefunktion zwischen den Intervallgrenzen a und b nimmt den für 
Dichtefunktionen üblichen Wert Eins an: 


b 
Pa<x<b)= | far = 1. (4.28) 
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EX) 





a= 120 min b = 140 min 


Abb. 4.13 Gleichverteilung 


Wir wollen diesen Sachverhalt durch ein kleines Beispiel verdeutlichen. Angenommen, 
für die Produktion eines Gutes sind mindestens 120 Minuten und höchstens 140 Minuten 
erforderlich, wobei eine Gleichverteilung wie folgt vorliegt (vgl. Abb. 4.13). 


1 en | ea 
fix) = mom" n fü 20<X <140 | (4.29) 


sonst 


Der Erwartungswert - also die Produktionsdauer, die durchschnittlich zu erwarten ist — 


beträgt: 


b 120 + 140 
gen 





— 130 Minuten. (4.30) 


Die Varianz beträgt: 


b=-2) 140 — 120)? 400 = 
= war = a), — — = 33,3 Minuten”. (4.31) 
12 12 12 


Wie groß ist die Wahrscheinlichkeit, dass der Produktionsprozess ... 


a. höchstens 125 Minuten dauert? 
b. mindestens 130 Minuten dauert? 
c. zwischen 125 und 130 Minuten dauert? 


Im Aufgabenteil a. ist der Flächeninhalt des schwarzen Rechtecks der linken Darstel- 
lung aus Abb. 4.14 gesucht. Der Flächeninhalt des schwarz markierten Rechtecks beträgt 
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„Höhe - Breite“: 


C 
1 
Pa <x<o= | far = 5 (c-a) (4.32) 
(ba) 

a 

sodass die Wahrscheinlichkeit einer Höchstdauer von 125 Minuten folgenden Wert an- 
nimmt: 1 

P(120 <X < 125) = — —— - (125 — 120) = 25%. 4.33 
In 2) ge " . 


Für Aufgabenteil b. ergibt sich analog (vgl. mittlere Darstellung aus Abb. 4.14): 


. (140 — 130) = 50 %. 


b 
l 
P<X<b)= | Sar= 556-4) = on) 
d 


(4.34) 
Die Wahrscheinlichkeit, dass die Produktionszeit zwischen 125 und 130 Minuten liegt, 
ergibt sich wiederum aus der Formel Höhe - Breite des schwarz markierten Rechtecks 
der rechten Grafik aus Abb. 4.14. Sie stellt die allgemeine Formel zur Berechnung von 
Wahrscheinlichkeiten aus gleichverteilten Dichtefunktionen dar: 


PesX<sd)= 4-0) (4.35) 


1 
P(125 <X < 130) = ae (130-125) = 25%. (4.36) 


4.2.2 Normalverteilung 


Die wohl wichtigste theoretische Verteilung ist die sogenannte Normalverteilung. Be- 
reits im Jahre 1738 veröffentliche der Hugenotte Abraham de Moivre in seiner zweiten 
Auflage des Werkes „Doctrine of Chances“ (de Moivre 1738) den Übergang der Bino- 
mialverteilung zu einer kontinuierlichen Normalverteilung, ohne allerdings bereits den 
Begriff Normalverteilung zu verwenden. Seinen Lebensunterhalt verdiente er im Übrigen 
mit der Beratung in Glücksspielangelegenheiten. Die Mathematiker Laplace (1749-1827) 
und Gauß (1777-1855) griffen diese Erkenntnisse in der Beschreibung der sogenannten 
„Fehlerkurve‘ auf. Diese gilt in den Naturwissenschaften seither als wichtiges Instrument, 
um die Unzulänglichkeiten von Messinstrumenten zu erklären. Die Naturwissenschaftler 
dieser Zeit standen nämlich vor dem Problem, dass die Messungen eines naturwissen- 
schaftlichen Sachverhaltes aufgrund der unzureichenden Messinstrumente schwankende 
Messergebnisse erbringen. Wird beispielsweise die Entfernungen zu Fixsternen gemessen, 
führen erste Messungen nicht selten zu völlig unterschiedlichen und weit auseinanderlie- 
genden Ergebnissen. Führt man viele weitere Messungen durch, so ergeben diese eine 
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Abb. 4.15 Idealtypischer Verlauf der Dichte einer Normalverteilung 


symmetrische und glockenförmige Kurve, deren Mittelwert zugleich den häufigsten Wert 
darstellt (vgl. Abb. 4.15). Dieser Wert wurde dann als die tatsächliche Entfernung ange- 
nommen. Aber erst Adolph-Lambert Que£telet (1796-1874) verwendete zum ersten Mal 
den Begriff der Normalverteilung: Diesem akrıbischen — wohl auch zum Teil idiosynkra- 
tischen — Wissenschaftler fiel auf, dass die Häufigkeitsverteilungen unterschiedlichster 
Messreihen dem der Gauß-Laplace’schen Fehlerkurve ähnelten: Die Körpergröße von 
Menschen, die Messung von Brustumfängen bei schottischen Soldaten etc., für alle Mess- 
reihen ermittelte er eine - für ihn naturgegebene — „normale“ Verteilung der Messergeb- 
nisse. Daher leitet sich auch dıe Bezeichnung der Normalverteilung ab. Selbstverständlich 
kommen in der Natur auch nicht-normalverteilte Eigenschaften vor, die sich allerdings 
nicht selten aus dem Zusammenwirken mehrerer normalverteilter Messreihen ergeben 
können (Swoboda 1971, S. 76ff.). 

Die Normalverteilung gilt heute als die vielleicht wichtigste Grundlage der Statistik. 
Doch wie sieht eine solche Normalverteilung (engl.: normal distribution) aus und was ist 
so besonders an ihr? Die idealtypische Normalverteilung ist in Abb. 4.15 dargestellt. Für 
den formal geübten Leser sei an dieser Stelle auch die Formel der Dichte der Normalver- 
teilung angegeben: 

Re I a (4.37) 

. ovV2-T 
Die Normalverteilung hat die Form einer Glocke, sie ist eingipflig und symmetrisch. Sie 
hat die Eigenschaft, dass unabhängig von den Messinhalten auf der x-Achse, die Vertei- 
lung mit nur zwei Parametern vollständig beschrieben werden kann: Dem Erwartungswert 
u und der Standardabweichung o, was bereits auch aus oben angegebener Formel der 


4.2 Stetige Verteilungen 69 


N(500;10) N(505;10) N(510;10) 





T f T T I I 





470 450 40 >00 >10 520 530 >40 


Abb. 4.16 Unterschiedliche Lage von Normalverteilungen 


Dichte der Normalverteilung ableitbar ıst, denn nur die Parameter u und o sind zu setzen. 
Entsprechend beschreibt man eine normalverteilte Zufallsvariable mit: 


X r N(u:o) (4.38) 


Der Erwartungswert stellt gleichzeitig die Symmetrieachse und den am häufigsten vor- 
kommenden Wert der Verteilung dar und ist mit dem Median der Verteilung identisch. Der 
Erwartungswert beschreibt die Lage einer Normalverteilung auf der x-Achse. Je größer 
der Erwartungswert, umso mehr verschiebt sich die Normalverteilung entlang der x-Achse 
nach rechts (vgl. Beispiele in Abb. 4.16). 

Nach links und rechts fällt die Dichte der Kurve ab und nähert sich beidseitig asympto- 
tisch der Abszisse. Die Größe der Standardabweichung der Normalverteilung beeinflusst 
dabei den Verlauf der Normalverteilung. Je größer der Wert der Standardabweichung, um- 
so flacher verläuft die Normalverteilung (vgl. Abb. 4.17). 

Bei einem Abstand von einer Standardabweichung (0) von u befindet sich der Wende- 
punkt der Normalverteilung. Legt man an diese Punkte eine Tangente, so schneidet diese 
die Normalverteilung bei einem Abstand von zwei Standardabweichungen (2-0). Im Inter- 
vall zwischen —o und +0 liegen ca. 68 Prozent, zwischen —2-o und +20 ca. 95 Prozent 
und zwischen —3-o und +30 ca. 99,7 Prozent der Beobachtungen (vgl.Abb. 4.15). 

Die Normalverteilung ist zudem reproduktiv: Sind zwei Zufallsvariablen X, und X, 
mit gleichen oder auch unterschiedlichen Erwartungswerten und Streuungen normalver- 
teilt mit N(u1;01) und N(u>; 07), so ist die Zufallsvariable X = X) + X> ebenfalls 


normalverteilt mit: 
N (x + 2; Jo + 02) (4.39) 


Besonderes Merkmal der Normalverteilung ist nun des Weiteren, dass die Fläche zwischen 
der x-Achse und der Normalverteilung immer gleich Eins (= 100 Prozent) ist, egal ob es 
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Abb. 4.17 Unterschiedliche Streuungen von Normalverteilungen 


sich um eine schmale, breite oder flache Normalverteilung handelt. Die Verteilung eignet 
sich auch deshalb besonders dazu, Wahrscheinlichkeiten für bestimmte Messwerte zum 
Ausdruck zu bringen. 

Die idealtypische Normalverteilung ist ein Denkmodell, das sich in der empirischen 
Realität niemals in 100 %-iger Genauigkeit erfüllt, allerdings hat die Annahme der Nor- 
malverteilung als Approximation der wahren Werte häufig seine Berechtigung. Der Phy- 
siker Gabriel Lippmann soll dazu einmal gesagt haben: „Alle Welt glaubt an die Normal- 
verteilung — die Mathematiker, weil sie glauben, es handle sich um eine experimentell 
nachgewiesene Tatsache; die Experimentatoren, weil sie glauben, es handle sich um ein 
mathematisches Theorem.“ (Swoboda 1971, S. 80) 

Aus der Familie aller Normalverteilungen hat die Normalverteilung mit einem Erwar- 
tungswert von u = O und einer Standardabweichung von o = 1 eine besondere Bedeu- 
tung gewonnen. Sie wird als „Standardnormalverteilung‘ (engl.: standard normal probabi- 
lity distribution) bezeichnet, denn aufgrund der doch sehr komplizierten Berechnung einer 
Normalverteilung wurde in Zeiten ohne Computer auf die in Abschn. 8.1 tabellierten Wer- 
te der Standardnormalverteilung zurückgegriffen. Denn letztlich lässt sich jede beliebi- 
ge Normalverteilung in eine Standardnormalverteilung transformieren, indem von jedem 
Wert einer Zufallsvariablen X der jeweilige Erwartungswert abgezogen und danach durch 
die Standardabweichung geteilt wird. Dieses Vorgehen nennt man „z-Transformation“: 


N 
Z= r 





(4.40) 
O0 


Aus X » N(u;o) ergibt sich somit 


Ko 
Ze 2 





x N(0:1). (4.41) 
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Abb. 4.18 Haltbarkeit eines Jogurts (1) 


Mit jeder normalverteilten Zufallsvariable X korrespondiert also eine standardnormal- 
verteilte Zufallsvariable Z, mit deren Hilfe Wahrscheinlichkeiten tabellarisch abgelesen 
werden können. 

Wir wollen dies anhand eines Beispiels verdeutlichen: Angenommen, die Haltbarkeit 
eines Jogurts sei N (30; 10)-verteilt, d.h., die Haltbarkeit beträgt im Durchschnitt 30 Ta- 
ge mit einer Standardabweichung von zehn Tagen. Mit welcher Wahrscheinlichkeit liegt 
die tatsächliche Haltbarkeit des Produktes bei höchstens 50 Tagen? Gesucht wird also 
der Wert für P(X < 50), was genau der grau markierten Fläche der oberen Grafik aus 
Abb. 4.18 entspricht. 

Leider ist der Wert 50 nicht aus einer Tabelle ablesbar, sodass die Normalverteilung 
N (30; 10) zunächst z-transformiert werden muss. Die Obergrenze des grau markierten 
Intervalls wird auf eine N (0; 1)-verteilte Zufallsvariable so übertragen, dass der Flächen- 
inhalt identisch bleibt. Aus dem Wert 50 einer N (30; 10)-verteilten Zufallsvariablen wird 
somit der Wert zwei einer standardnormalverteilten Zufallsvariablen (vgl. untere Grafik 
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aus Abb. 4.18). Die rechnerische Lösung erfolgt über den Ansatz: 





(= —*) ( u. 
PX<50)>P(X-u<s<50-u=>P|———- <—-|>PIZ<s 

o o 10 

= P(22 2) 
(4.42) 

Die Werte für P(Z < 2) lässt sich der Tabelle der Standardnormalverteilung (vgl. 
Abschn. 8.1) entnehmen. Der Wert für P(Z < 2) = 0,9772 entspricht dem der Zeile 
2.0 (für den Wert 2 und die erste Dezimalstelle 0) und der Spalte 0.00 (für die zweite 
Dezimalstelle 0). 

Auch für Wahrscheinlichkeiten mit festgelegten Ober- und Untergrenze eines Intervalls 
lassen sich Wahrscheinlichkeiten bestimmen: 





P(K<SÄ<SX) PP -USÄ-U<K HM). (4.43) 
ge Ye Ye 
> P (> < 2 =). (4.44) 
O0 O0 O0 
Ye Ks 
er(=#=z= = (4.45) 
O0 O0 


Nehmen wir wieder an, die Haltbarkeit eines Jogurts sei N (30; 10)-verteilt. Mit welcher 
Wahrscheinlichkeit liegt die tatsächliche Haltbarkeit des Produktes zwischen 30 und 40 
Tagen? Gesucht wird also der Wert für P(30 < X < 40), was genau der grau markierten 
Fläche der oberen Grafik aus Abb. 4.19 entspricht. 

Durch die z-Transformation erfolgt wiederum eine Übertragung der Grenzen auf eine 
N (0; 1)-verteilte Zufallsvariable derart, dass der Flächeninhalt identisch bleibt (vgl. untere 
Grafik aus Abb. 4.19). Die rechnerische Lösung erfolgt über den Ansatz: 


Oo Oo 








Re 
I = 10 





Pa ===> r(— —, )>rosz<n 
o 

(4.46) 
Die gesuchte Wahrscheinlichkeit entspricht dem Flächeninhalt für die gesamte Fläche der 
Standardnormalverteilung von —oo bis zur Intervallobergrenze P(Z < 1) abzüglich der 
Fläche von —oo bis zur Intervalluntergrenze P(Z < 0). Dieser Zusammenhang ist in 
Abb. 4.20 beispielhaft dargestellt und ergibt: 


PUSZ<Ee)=eP zz eb P/Z SD), (4.47) 
Die Werte für P(Z < 1) und P(Z < 0) lassen sich wiederum der Tabelle der Stan- 


dardnormalverteilung (vgl. Abschn. 8.1) entnehmen. Der Wert für P(Z < 0) = 0,5000 
entspricht dem der Zeile 0.0 (für den Wert O und die erste Dezimalstelle 0) und der Spalte 
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Abb. 4.19 Haltbarkeit eines Jogurts (2) 


0.00 (für die zweite Dezimalstelle O0) und der Wert für P(Z < 1) = 0,8413 entspricht 
dem der Zeile 1.0 und der Spalte 0.00. Es ergibt sich somit eine Wahrscheinlichkeit von 
34,13 Prozent: 


P0<Z<1)= P(Z <1)- P(Z < 0) = 0,8413 — 0,5000 = 34,13%. (4.48) 


In Abb. 4.21 wırd die Berechnung von Wahrscheinlichkeiten mit Hilfe der Tabelle der 
Standardnormalverteilung anhand von Beispielen nochmals vertieft. 

Das letzte Beispiel zeigt, dass aufgrund der Symmetrie der Standardnormalverteilung 
die Fläche, die rechts eines positiven x-Werts liegt (z.B. rechts von 2,5), genau so groß 
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Abb. 4.20 Berechnung der Wahrscheinlichkeit einer z-transformierten Zufallsvariablen 


wie die Fläche ist, die links des gleichen x-Wertes mit negativen Vorzeichen liegt (z.B. 
links von —2,5). Es gilt also: 


e P(Z > 1,65) = P(Z < (-1,65)) = 0,05, 

e P(Z > 1,96) = P(Z < (-1,96)) z 0,025, 
e P(Z > 2,58) = P(Z < (-2,58)) = 0,005, 
e P(Z > 3,00) = P(Z < (-3,00)) z 0,001. 
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Die Brenndauer einer Glühlampe sei normalverteilt mit einem Mittelwert von 900 
Stunden und einer Standardabweichung von 100 Stunden. Die Brenndauer sei also 
N(900;100)-verteilt. Bestimmen Sie die Wahrscheinlichkeit von Brenndauern... 


...VonN 
höchstens N(0;1) 


2 den & 1050 — 900 
100 


P(221,5)-93,22% ; 


4 2325 232 25 2 Js 2 985 0 0.5 1 1.5 2 2.5 3 3.5 4 
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Abb. 4.21 Berechnung von Wahrscheinlichkeiten mit der Standardnormalverteilung 


Sehr gute Zusammenfassungen über die Normalverteilung finden sich ım Internet unter: 


e https://www.youtube.com/watch”v=9la6r8EuuCw 
e https://www.youtube.com/watch?v=y7sISN6A3EM 


4.2.2.1 Berechnung der Normalverteilung mit Excel 

Mit Excel erfolgt die Berechnung der Wahrscheinlichkeitswerte, indem nach der Menü- 
folge Formeln — Funktionen Einfügen dıe Funktion NORM.VERT gewählt wird (vgl. 
oberer Teil der Abb. 4.22). Nach Eingabe des x-Wertes, des Erwartungswertes, der Stan- 
dardabweichung und der Setzung des Wertes Eins für den Parameter kumuliert wird das 
einseitige Intervall der kumulierten Wahrscheinlichkeit für p = (1 — «) ausgegeben. Für 
einen gegebenen x-Wert von x = 2,33 ergibt sich bei einem Erwartungswert u = 0 und 
der Standardabweichung o = 1 eine kumulierte Wahrscheinlichkeit von p *= 0,99. Die 
Berechnung mit Excel erfolgt durch die Funktion NORM. VERTX2,33;0; 1). 


76 4  Zufallsvariablen und Wahrscheinlichkeitsverteilungen 

















— Angabe des x-Wertes (Quantil) der Verteilung (x=2.33). 

















NORSLVERT Erwartungswert der Normalverteilung (1u=0). 
I en a = | Standardabweichung der Normalverteilung (0=1). 
Mittehwert 0 u =» 
Stamdaben 1 3 2 Kumuliert=1 (WAHR): liefert die kumulierte 
Kumlkort =) - wur Wahrscheinlichkeit p. 


ee ; “ . . 
Gb Wahre rer normal verteilten SWaßsarishları furgck Ergebnis: Die kumulierte Wahrscheinlichkeit p>0.99. 


Kult Eu a rate: Für die ren erben WAHR; Tür de 
Weirschenichketsäichteäunktion FALSCH 


Formekerngebaig m 0.0B 


bit. Für diese. Furskiigee | [e | | Abbrechen 


Syntax: NORM.VERT(x;Mittelwert;Standardabweichung;Kumuliert); NORM.VERT(2.33;0;1;1) 
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Syntax: NORM.INV(Wahrscheinlichkeit; Mittelwert; Standardabweichung); NORM.INV (0.9;0;1) 


Abb. 4.22 Berechnung der Normalverteilung mit Excel 


Umgekehrt kann über die Funktion NORM.INV für eine gegebene kumulierte Wahr- 
scheinlichkeit p = (1 — «) und bei gegebenem Erwartungswert und gegebener Standard- 
abweichung der entsprechende (kritische) x-Wert (Quantil) der Normalverteilung berech- 
net werden (vgl. unterer Teil der Abb. 4.22). So ergibt die Funktion NORM.INV(0,9;0; 1) 
für eine Wahrscheinlichkeit von p = (1 -«) = 0,9, einem Erwartungswert u = O0 und 
einer Standardabweichung o = 1 den Normalverteilungswert x * 1,28. 

Liegt ein zweiseitiges Intervall vor und verteilt sich die Gesamtfläche für « gleicherma- 
Ben auf beiden Seiten der Normalverteilung, so ergibt sich für die Obergrenze ein x-Wert 
von X(1-a/2) und für die Untergrenze ein x-Wert von xX(a/2). Für das obige Beispiel einer 
Wahrscheinlichkeit von p = 0,9 bei einem Erwartungswert u = O und einer Standardab- 
weichung o = 1 ergibt sich mit NORM.INV(0,95,0;1) ein x-Wert von x95% * 1,65 und 
mit NORM.INV(0,05;0; 1) ein x-Wert von x5% X —1,65. 


4.2.2.2 Berechnung der Normalverteilung mit Stata 
Der Befehl display normal(z) ermittelt die kumulierte Wahrscheinlichkeit p bei gege- 
benem z-Wert einer Standardnormalverteilung. Die Syntax display normal(1.96) ergibt 
entsprechend den Wert p = 0,975. Liegt keine Standardnormalverteilung, sondern eine 
Normalverteilung mit beliebigen u und o vor, so ist der x-Wert zu standardisieren und fol- 
gende Syntax zu verwenden: display normal((x- u)/o ). Der Befehl display normal((7-3)/4) 
ergibt für N (3,4) und einem Wert für x = 7 eine Wahrscheinlichkeit von p = 0,8413. 
Analog berechnet display invnormal(p) den z-Wert eines einseitigen Intervalls unter 
der Annahme einer gegebenen kumulierten Wahrscheinlichkeit p. So ergibt die Funktion 
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Berechnet die kumulierte Wahrscheinlichkeit für p bei gegebenem z- display normal(z) 
Wert einer Standardnormalverteilung. 


Bsp.: Für z=1,96 und N(0;1) ergibt sich eine kumulierte Wahrschein- display normal(1.96) 
lichkeit p=0.975. . 9750021 


Bsp.: Für x=7 und N(3;4) ergibt sich eine kumulierte Wahrscheinlich- display normal((7-3)/4) 
keit p=0,841. 84134475 


Berechnet den z-Wert eines einseitigen Intervalls unter der Annahme display invnormal(p) 
einer gegebenen kumulierten Wahrscheinlichkeit p einer Standard- 
normalverteilung. 


Bsp.: Für p=0,9 und N(0;1) ergibt sich ein z-Wert von z=1,28. display invnormal(0.9) 
1.2815516 


Bsp.: Für p=0,9 und N(3;4) ergibt sich ein Wert von x=8,13. display 3tinvnormal(0.9)*4 
8.1262063 





Abb. 4.23 Berechnung der Normalverteilung mit Stata 


display invnormal(0.9) den z-Wert von z x 1,28 (vgl. Abb. 4.23). Für Normalverteilungen 
mit beliebigen u und o kann der z-Wert in den x-Wert durch Anwendung von (tL +Zz-0 re- 
transformiert werden. Der Befehl display 7+invnormal(0.9)*4 berechnet beispielsweise 
den Wert x = 8,13 einer N (3; 4)-verteilten Zufallsvariablen für die Wahrscheinlichkeit 
09° 


4.3 Weitere wichtige Testverteilungen 


Neben der Normalverteilung haben drei weitere theoretische Verteilung eine gewisse Be- 
rühmtheit erlangt. Hierzu zählen die 7-Verteilung, die F-Verteilung und die Chi-Quadrat- 
Verteilung (x°-Verteilung). Der Grund hierfür liegt weniger in der Tatsache begründet, 
dass diese Verteilungen in einem Zusammenhang mit der Normalverteilung stehen, son- 
dern vielmehr darin, dass sie für das Testen von statistischen Hypothesen von besonderer 
Bedeutung sind. Deshalb werden diese Verteilungen häufig auch als Testverteilungen be- 
zeichnet. Die Idee des statistischen Testens werden wir in Kap. 6 genauer kennenlernen, 
die Besonderheiten der drei Testverteilungen wollen wir uns bereits ın den nächsten Ab- 
schnitten genauer ansehen. 


Eine sehr gute Darstellung über die Vorgehensweise bei Stata findet sich hier: https://www. 
youtube.com/watch?v=Os4kEJdwIyU. 
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Abb. 4.24 Dichtefunktion der Chi-Quadrat-Verteilung bei unterschiedlichen Freiheitsgraden (df) 


4.3.1 Chi-Quadrat-Verteilung 


In der empirischen Praxis spielt die Chi-Quadrat-Verteilung (engl.: chi-squared distribu- 
tion) — häufig auch als y* Verteilung abgekürzt — eine sehr wichtige Rolle, denn sie ist 
Grundlage vieler einschlägiger Testverfahren. Sie wurde 1876 vom deutschen Mathe- 
matiker Friedrich Robert Helmert erstmals beschrieben, geriet danach aber zunächst in 
Vergessenheit. Erst Karl Pearson konnte ihren großen Nutzen bei statistischen Testver- 
fahren zeigen (Swoboda 1971, S. 326). Die Dichtefunktionen der Chi-Quadrat- Verteilung 
haben je nach Anzahl der Freiheitsgrade — diese werden häufig auch mit df für „degrees 
of freedom“ abgekürzt — einen unterschiedlichen Verlauf (vgl. Abb. 4.24). 

Die Herleitung der Verteilung basiert auf der Idee quadrierter standardnormalverteilter 
Zufallsvariablen. So folgt das Quadrat einer N(0;1)-verteilten Zufallsvariablen einer Chi- 
Quadrat-Verteilung mit einem Freiheitsgrad: 


Z’nx. (4.49) 


Die Summe der Quadrate zweier voneinander unabhängiger und standardnormalverteilten 
Zufallsvariablen Zı und Z> folgt einer X*-Verteilung mit zwei Freiheitsgraden: 


ZI + Zir y2. (4.50) 
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Verallgemeinert man diesen Fall und bildet die Summe der Quadrate von n vonein- 
ander unabhängigen und standardnormalverteilten Zufallsvariablen, ergibt sich eine 
x*-Verteilung mit n Freiheitsgraden: 


ZI +Z7+...+Z’r x. (4.51) 


Die Gesamtfläche unterhalb der Dichte einer X*-Verteilung ergibt wiederum den Wert 1. 
Die Fläche innerhalb eines bestimmten Intervalls beschreibt die Wahrscheinlichkeit, dass 
sich ein zufälliger y*-Wert in diesem Intervall befindet (Bortz und Schuster 2010, S. 75). 
Wie bei der Normalverteilung ist die Berechnung der Fläche - und damit die Bestimmung 
der Wahrscheinlichkeit - ohne Computer oder ohne die Verwendung einer y*-Tabelle auf- 
wändig. Die x°-Tabelle ist für eine Auswahl wichtiger Quantile und Freiheitsgrade in 
Abschn. 8.2 dargestellt. Für die Wahrscheinlichkeit von (1 —«&) = 90 % und 20 Freiheits- 
grade ergibt sich beispielsweise ein Quantil von ie 0 = 28,412. 
Zwei Besonderheiten der y?-Verteilung sollen an dieser Stelle noch erwähnt werden: 


e Mit zunehmender Anzahl von Freiheitsgraden nimmt die y?-Verteilung den Verlauf 
einer Normalverteilung an. 

e Wie die Normalverteilung und die Poisson-Verteilung ist auch die y*-Verteilung repro- 
duktiv: Addiert man also zwei unabhängige und y?-verteilte Zufallsvariablen, so ergibt 
sich wiederum eine *-Verteilung, deren Freiheitsgrade der Summe der Freiheitsgrade 
der beiden Ursprungsverteilungen entsprechen. 


4.3.1.1 Berechnung der Chi-Quadrat-Verteilung mit Excel 

Mit Excel erfolgt die Berechnung der Wahrscheinlichkeitswerte, indem nach der Menüfol- 
ge Formeln — Funktionen Einfügen die Funktion CHIOU.VERT (vgl. Abb. 4.25) gewählt 
wird. Nach Eingabe des gewünschten Chi-Quadrat-Wertes, der Anzahl der Freiheitsgrade 
und der Setzung des Wertes Eins für den Parameter kumuliert wird das einseitige Intervall 
der kumulierten Wahrscheinlichkeit für p = (1 — «) ausgegeben. Für einen gegebenen 
Chi-Quadrat-Wert von y* = 5,991 ergibt sich bein = 2 Freiheitsgraden eine kumulierte 
Wahrscheinlichkeit von p = (1-.«) * 0,95. Die Berechnung mit Excel erfolgt durch die 
Funktion CHIOU.VERT(5.991;2;1). 

Umgekehrt kann über die Funktion CHIQU./NV (vgl. Abb. 4.25) für eine gegebene 
kumulierte Wahrscheinlichkeit und für gegebene Freiheitsgrade der entsprechende Chi- 
Quadrat-Wert eines einseitigen Intervalls berechnet werden. So ergibt für eine kumulierte 
Wahrscheinlichkeit von p = (1 -.«) = 0,9bein = 20 Freiheitsgraden die Funktion 
CHIQU.INV(0,9;20) den Chi-Quadrat-Wert X5g4.0 = 28,412. 


4.3.1.2 Berechnung der Chi-Quadrat-Verteilung mit Stata 

In Abb. 4.26 sind die Berechnungen der Chi-Quadrat-Verteilung mit Hilfe der Stata- 
Syntax zusammengefasst. Mit Hilfe der Syntax display invchi2tail(n,a) erfolgt die Be- 
rechnung des Chi-Quadrat-Wertes eines einseitigen Intervalls unter der Annahme einer 


80 4  Zufallsvariablen und Wahrscheinlichkeitsverteilungen 


Me Angabe des kritischen X?-Wertes (x?=5,991). 
Funkbonsargumente .E 5 X (X ) 
CHIIULVERT Anzahl der Freiheitsgrade (n=2). 








m Bu = a Ergebnis: Die kumulierte Wahrscheinlichkeit ist p=0.95. 
Freiheitsgrade 2 | = a 
Kult 2] zul = wanr 
= ee 


a erte der en Vereungeunkdön [L-Adokha' ar Du-Zusdret-verlern Sulalsgröle turuck. 


Kusmallert ri Wahrheit, des dee Fariklion Furucköebes snl- de bermulatse 
Verbeiungstunktön AH de en naeenehhen n FALSCH 


Formelegebritn Der 


Angabe der kumulierten Wahrscheinlichkeit p=0,9. 












CHBOBI Anzahl der Freiheitsgrade (n=20). 
Wahrsch 1.3 | =» as , ae 2 a 
: Ar — Ergebnis: Kritischer x?-Wert (Quantil). 
m SEES 
Gt. Ferzeruule der beissen DPQuscr pr erbaute] Bari, sine Fall von re ] 


Freiheitsgrade I: 4 Anzahl der Freihaitsgr ade, eins Zahl größer acer gleich 1 und kleinar ale DO“ E0 






Lo) [isnoe 


Syntax: CHIQU.INV (Wahrsch;Freiheitsgrade); CHIQU.INV (0,9;20) 


Abb. 4.25 Berechnung der Chi-Quadrat-Verteilung mit Excel 


Berechnet die Wahrscheinlichkeit für o=(1-p) bei gegebenem x°-Wert display chi2tail(n,x) 
und n Freiheitsgraden. 


Bsp.: Für x=5,991 ergibt sich bei n=2 Freiheitsgraden eine Wahrschein- | display chi2tail(2,5.991) 
lichkeit (1-p)=0-0,05. .05001162 


Berechnet den x’-Wert eines einseitigen Intervalls unter der Annahme | display invchi2tail(n,o) 
einer gegebenen Wahrscheinlichkeit (1-p)=oa bei n Freiheitsgraden. 


Bsp.: Für p=0,9 ergibt sich bei n=20 Freiheitsgraden ein y’-Wert 
display invchi2tail(20,0.1) 
28.411981 


2 
von X 90%;20 =28,412. 





Abb. 4.26 Berechnung der Chi-Quadrat- Verteilung mit Stata 


gegebenen Wahrscheinlichkeit & bei n Freiheitsgraden. Im Gegensatz zu Excel ist für die 
Wahrscheinlichkeit also nicht der Wert für p = (1 — a), sondern der Wert für & ein- 
zugeben. Ist also der Chi-Quadrat-Wert für die kumulierte Wahrscheinlichkeit für p = 
(1-«&) = 0,9 gesucht, muss der Wert & = 0,1 eingegeben werden. So ergibt für p = 0,9 
bein = 20 Freiheitsgraden die Funktion display invchi2tail(20,0.1) den Chi-Quadrat- 
Wert KSon2o 7 28,412. 

Analog ermittelt display chi2tail(n,x) den Wert für die Wahrscheinlichkeit von «a. Die 
Syntax display chi2tail(2,5.991) ergibt entsprechend den Wert & = 0,05. 
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4.3.2 Die Student-:-Verteilung 


Eine weitere — aus der Normal- und der Chi-Quadrat-Verteilung abgeleitete Verteilung — 
ist die sogenannte 7-Verteilung. Sie wurde zu Beginn des zwanzigsten Jahrhunderts erst- 
mals von William Sealy Gosset (1876-1937) - einem in der englischen Guinness-Brauerei 
tätigen Chemikers - beschrieben. Da ihm sein Arbeitgeber wissenschaftliche Publikatio- 
nen untersagt hatte, veröffentlichte er seine Erkenntnisse unter dem Pseudonym „Student“, 
weshalb die t-Verteilung häufig auch als Student-Verteilung bezeichnet wird. Ziel seiner 
Forschungsarbeit war die Entwicklung von statistischen Verfahren, die auch mit sehr klei- 
nen Stichproben auskommen. Ausgangspunkt war die Fragestellung, wie die Anzahl der 
Hefebakterien im Bier mit Hilfe kleiner Stichproben ermittelt werden kann. 

Intuitiv hat man bei kleinen Stichprobengrößen eher Bedenken hinsichtlich der Re- 
präsentativität von Ergebnissen, aber vielfach bleibt einem in der Praxis keine andere 
Wahl: Insbesondere wenn ein zerstörendes Prüfverfahren - also ein Prüfverfahren, bei 
dem zur Überprüfung der Produktqualität das Prüfobjekt selbst zerstört werden muss — 
für ein teures Produkt angewendet werden muss, ist der Wunsch nach besonders kleinen 
Stichproben groß. Auch bei der Überprüfung neuer Arzneien auf ihre Nebenwirkungen 
beim Menschen stehen selten große Stichproben zur Verfügung. Es ist insbesondere Sir 
Ronald A. Fisher (1890-1962) zu danken, die Ergebnisse Gossets in Hinblick auf die 
Testtheorie erweitert zu haben. Von Seiten der „dogmatischen“ Vertreter der Wahrschein- 
lichkeitstheorie wurde der Ansatz der kleinen Stichproben eher abfällıg bewertet: Noch 
in den SOer-Jahren des letzten Jahrhunderts hielten viele Wahrscheinlichkeitstheoretiker 
die Möglichkeit, aus Stichproben mit zwei oder unwesentlich mehr Werten, Erkenntnis- 
se über die Grundgesamtheit erlangen zu können, für ein unmögliches Unterfangen. Der 
Wahrscheinlichkeitstheoretiker Richard von Mises (1883-1953) kommentierte beispiels- 
weise: „Diese Entwicklung führt durch eine Periode, in der die abwegige Idee verfolgt 
wurde, aus kleinen Beobachtungsfolgen statistische Schlüsse zu ziehen: die sogenannte 
‚small sample theory‘.“ (Swoboda 1971, S. 205). 

Wıe man heute weiß, irrte Richard von Mises gewaltig: Viele auf die t-Verteilung und 
deren Grundidee fußende Testverfahren sind heute gängige Instrumente statistischer Aus- 
wertungsmethoden. Hierzu gehört beispielsweise der später noch zu beschreibende /-Test, 
der sogar seinen Namen aus der 7-Verteilung bezieht, oder Verfahren wie die Regres- 
sıionsanalyse, für deren Interpretation die t-Werte von Regressionskoeffizienten benötigt 
werden. 

Wie sieht nun diese f-Verteilung aus? In Abb. 4.27 sind beispielhaft unterschiedliche 
t-Verteilungen abgebildet. Sie erinnern in ihrer eingipfligen und ihrer um den Nullpunkt 
verteilten’ symmetrischen Form an die Normalverteilung. Und tatsächlich sind die Eigen- 
schaften der 7-Verteilung denen der Normalverteilung sehr ähnlich. Auch bei der Dichte 


"Mit E(X) = O und Var(X) = /-5: 
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Abb. 4.27 t-Verteilung bei unterschiedlichen Freiheitsgraden 


der 7-Verteilung entspricht die Fläche zwischen der x-Achse und der t-Verteilungskurve 
unabhängig von der Form der Kurve immer dem Wert Eins (= 100 Prozent). 

Wo findet die f-Verteilung nun ihre besondere Anwendung? Aus Abschn. 4.2.2 wis- 
sen wir, dass normalverteilte Werte in eine Standardnormalverteilung überführt werden 
können, indem folgende Formel angewendet wird: 
z=7 = 7.0). (4.52) 

0% Rn 








Beim Ziehen einer Stichprobe sind 1.d.R. aber weder Mittelwert noch Standardabwei- 
chung der Grundgesamtheit bekannt. Diese werden mit Hilfe der Stichprobe durch u bzw. 
Stheor geschätzt. Bei hinreichend großer Stichprobe (n > 30) ist dies unproblematisch, da 
— wie später gezeigt wird — der Mittelwert einer Stichprobe annähernd einer Normalver- 
teilung folgt, auch wenn die Einzelwerte der Grundgesamtheit nicht normalverteilt sind. 
Ist die Stichprobe nun kleiner als n = 30, die Werte der Grundgesamtheit sind aber annä- 
hernd normalverteilt, erfolgt die Standardisierung der Werte wie folgt: 


A = (4.53) 
— Stheor 
5: Yn 





Die Schätzwerte Siheor Varlieren dabei abhängig von der Stichprobengröße. Entsprechend 
ıst der Verlauf einer 7-Verteilung ebenfalls abhängig von der Größe der Stichprobe. 
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Nun wird man vergeblich den Begriff „Stichprobengröße“ im Zusammenhang mit der 
t-Verteilung finden. Vielmehr verwendet man den Begriff der Freiheitsgrade. Letztere 
berechnen sich aber aus der Stichprobengröße und spiegeln somit die Unsicherheit von 
kleineren Stichprobenergebnissen wider.° 

Abb. 4.27 macht die unterschiedlichen Verläufe von f-Verteilungen mit verschiede- 
nen Freiheitsgraden deutlich. Im Gegensatz zur Normalverteilung unterscheiden sie sich 
hinsichtlich ihrer Freiheitsgrade: Je kleiner die Stichprobe, umso schmalgipfliger ıst die 
t-Verteilung und umso häufiger treten Beobachtungswerte bei den linken und rechten Aus- 
läufern der t-Verteilung auf. Je größer die Stichprobe, umso „zentrierter“ werden i.d.R. 
die Schätzwerte. Entsprechend verteilen sich die Beobachtungswerte weniger in den lin- 
ken und rechten Ausläufern, sondern eher dicht an der Symmetrieachse der 1-Verteilung. 
Mit dieser Grundidee wird der größeren Unsicherheit bei kleinen Stichproben Rechnung 
getragen. 

Je größer die Stichprobe nun wird, umso mehr nähert sich die t-Verteilung tenden- 
ziell dem Verlauf der Normalverteilung. Theoretisch kann bewiesen werden, dass die 
t-Verteilung für eine gegen unendlich strebende Stichprobengröße (n — oo) gegen die 
Normalverteilung konvergiert. Bereits ab einer Stichprobengröße von mehr als 30 Beob- 
achtungen ist der Unterschied zwischen den Werten einer Normalverteilung und denen 
einer f-Verteilung kaum noch bedeutsam, weshalb 1. d. R. bei mehr als 30 Beobachtungen 
wieder die Normalverteilung verwendet wird. 

Die Wahrscheinlichkeitswerte einer t-Verteilung lassen sich aus der entsprechenden 
t-Tabelle bestimmen. Diese ıst in Abschn. 8.3 für bestimmte Wahrscheinlichkeitswerte 
(in den Spalten) und für bestimmte Freiheitsgrade (in den Zeilen) dargestellt. Für einen 
Wahrscheinlichkeitswert von p = 0,9 und 30 Freiheitsgraden ergibt sich beispielsweise 
ein f-Wert von ee: — 1,3104. 


4.3.2.1 Berechnung der /-Verteilung mit Excel 

Mit Excel (vgl. Abb. 4.28) erfolgt die Berechnung der Wahrscheinlichkeitswerte, indem 
nach der Menüfolge Formeln — Funktionen Einfügen die Funktion T. VERT gewählt wird. 
Nach Eingabe des gewünschten (kritischen) 7-Wertes, der Freiheitsgrade und der Setzung 
des Wertes Eins für den Parameter Kumuliert wird das einseitige Intervall der kumulierten 
Wahrscheinlichkeit für p = (1 — «) ausgegeben. Für einen gegebenen 1-Wert von ft = 


® Letztlich steht der Begriff der Freiheitsgrade auch in Zusammenhang mit der theoretischen Ab- 
leitung der t-Verteilung. Eine r-Verteilung mit n Freiheitsgraden ist nämlich das Ergebnis aus dem 
Quotient einer standardnormalverteilten Zufallsvariablen (N (0; 1)) und einer hiervon unabhängigen 
x*-verteilten Zufallsvariablen mit n Freiheitsgraden: 





Pe 
Xn 
n 


Die Freiheitsgrade der 7-Verteilung sind also ein Ergebnis der entsprechenden Freiheitsgrade der 
x°-verteilten Zufallsvariablen (vgl. Bortz und Schuster (2010, S. 75)). 
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Angabe des gewünschten (kritischen) t-Wertes (t=3,078). 
Anzahl der Freiheitsgrade (n=1). 
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Ergebnis: Die kumulierte Wahrscheinlichkeit ist p=0.90. 
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Angabe der kumulierten Wahrscheinlichkeit p=0,9. 
Anzahl der Freiheitsgrade (n=30). 
Ergebnis: Kritischer t-Wert (Quantil). 
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Syntax: T.INV (Wahrsch;Freiheitsgrade); T.INV (0,9;30) 


Abb. 4.28 Berechnung der 1-Verteilung mit Excel 


3,078 ergibt sich bei n = 1 Freiheitsgrad eine kumulierte Wahrscheinlichkeit von p = 
0,9. Die Berechnung mit Excel erfolgt durch die Funktion T. VERT(3,078;1;1). 

Umgekehrt kann über die Funktion 7./NV für eine gegebene Wahrscheinlichkeit und für 
gegebene Freiheitsgrade der entsprechende (kritische) 7-Wert berechnet werden. So ergibt 
die Funktion 7.INV(0,9; 10) bei einer kumulierten Wahrscheinlichkeit von p = (1- a) = 
0,9 und bei n = 10 Freiheitsgraden den t-Wert oe = 1932, 

Liegt ein zweiseitiges Intervall vor und verteilt sich die Gesamtfläche für & gleicher- 
maßen auf beiden Seiten der t-Verteilung, so ergibt sich für: 


e die Obergrenze ein t-Wert von f'_. und 
e für die Untergrenze ein t-Wert von te. 
2, 


Für das obige Beispiel einer Wahrscheinlichkeit von p = 0,9 bein = 10 Freiheitsgraden 
ergibt sich mit T.INV(0,95;10) ein t-Wert von tgg., = 1,812 und mit T.INV(0,05;10) ein 
t-Wert von en — — 1,812. 


4.3.2.2 Berechnung der 1-Verteilung mit Stata 

In Abb. 4.29 sind die Berechnungen der t-Verteilung mit Hilfe der Stata-Syntax zusam- 
mengefasst. Mit Hilfe der Syntax display invttail(n,«) erfolgt die Berechnung des 7-Wertes 
eines einseitigen Intervalls unter der Annahme einer gegebenen Wahrscheinlichkeit «& bei 
n Freiheitsgraden. Im Gegensatz zu Excel ıst für die Wahrscheinlichkeit also nicht der 
Wert für die kumulierte Wahrscheinlichkeit p = (1 — «), sondern der Wert für « ein- 
zugeben. Ist also der 7-Wert für die kumulierte Wahrscheinlichkeit p = (1-«) = 0,9 
gesucht, muss der Wert « = 0,1 eingegeben werden. So ergibt für p = 0,9bein = 30 
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Berechnet die Wahrscheinlichkeit (1-p)=o bei gegebenem t-Wert undn | display ttail(n,t) 
Freiheitsgraden. 


Bsp.: Für t=3,078 ergibt sich bei einem Freiheitsgrad eine Wahrschein- | display ttail(1,3.078) 
lichkeit (1-p)=a=0.09999028. .09999028 


Bsp.: Die kulminierte Wahrscheinlichkeit für t=3,078 und einem Frei- display 1-ttail(1,3.078) 
heitsgrad beträgt p=(1-0)=0.9. ‚90000962 


Berechnet den t-Wert eines einseitigen Intervalls unter der Annahme display invttail(n,c.) 
einer gegebenen Wahrscheinlichkeit (1-p)=«a bei n Freiheitsgraden. 


Bsp.: Für a=0,1 (d.h. für p=0,9) ergibt sich bei n=30 Freiheitsgraden ein | display invttail(30,0.1) 
t-Wert von en =1,3104. 1.3104 





Abb. 4.29 Berechnung der t-Verteilung mit Stata 


Freiheitsgraden die Funktion display invttail(30,0.1) den t-Wert t%,., = 1,3104. Analog 
ermittelt display ttail(n,t) den Wert für «. Die Syntax display ttail(1,3.078) ergibt den Wert 
a = 0.1. 


4.3.3 F-Verteilung 


Die F-Verteilung wurde nach dem britischen Biologen und Statistiker Roland Aylmer 
Fischer (1890-1962) benannt. Sie ist eng verwandt mit der t-Verteilung und der Chi- 
Quadrat-Verteilung und findet insbesondere Anwendung, wenn es darum geht, entweder 
die Varianzgleichheit zweier Stichproben oder den Mittelwertunterschied mehrerer Stich- 
proben zu überprüfen. Die Überprüfung von Mittelwertunterschieden wird auch als Va- 
rıanzanalyse (engl.: Analysıs of Variance (ANOVA)) bezeichnet und wir werden dieses 
Verfahren im weiteren Verlauf des Buches kennenlernen (vgl. Abschn. 6.4.1). 

Theoretisch entsteht eine F-Verteilung, wenn zwei unabhängige Zufallsvariablen — 
nennen wir sie U und V - jeweils einer x°-Verteilung folgen. Aus dem Abschn. 4.3.1 
wissen wir, dass eine y”-Verteilung mit Freiheitsgraden verbunden ist. Angenommen, ei- 
ne Zufallsvariable U folge nun einer x°-Verteilung mit m und die Zufallsvariable V einer 
x°-Verteilung mit n Freiheitsgraden. Es gilt also: 


Ur y,undV x.y%. (4.54) 


? Sehr gute Darstellungen über die Vorgehensweise bei Stata finden sich hier: https://www.youtube. 
com/watch?v=Es-Yyq_MeBY und hier: https://www.youtube.com/watch?v=YNMGbm4CBvA. 
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1.4 
1.2 —-F(2;10) 
1 —F(3;50) 
08 F(5;80) 
ü 
I F(40;40) 
0 /R 


u N 
0.2 x 


Abb. 4.30 F-Verteilungen 


Der Quotient 


Peleol, (4.55) 


=[<|2]S 


ist dabei F-verteilt mit m Freiheitsgraden im Zähler und n Freiheitsgraden im Nenner. 
Es existiert — analog zu den anderen Testverteilungen - also eine ganze Familie von F- 
Verteilungen, deren Verläufe abhängig von der Kombination der beiden Freiheitsgraden 
ım Zähler und im Nenner sind. Eine Auswahl von F-Verteilungen mit unterschiedlichen 
Kombinationen von Freiheitsgraden ist beispielhaft in Abb. 4.30 dargestellt. Es ist deutlich 
zu erkennen, dass F-Verteilungen mit ausschließlich positiven Werten rechtsschief und 
asymptotisch zur x-Achse verlaufen. 


4.3.3.1 Berechnung der F-Verteilung mit Excel 

Mit Excel erfolgt die Berechnung der Wahrscheinlichkeitswerte, indem nach der Menüfol- 
ge Formeln — Funktionen Einfügen die Funktion E!VERT gewählt wird (vgl. Abb. 4.31). 
Nach Eingabe des gewünschten (kritischen) F-Wertes, den Freiheitsgraden für m und n 
und der Setzung des Wertes Eins für den Parameter kumuliert, wird das einseitige Intervall 
der kumulierten Wahrscheinlichkeit für p = (1 — «) ausgegeben. Für einen gegebenen 
F-Wert von F = 2,3640 ergibt sich z.B. beim = 13 und n = 9 Freiheitsgraden eine 
kumulierte Wahrscheinlichkeit von p = (1—-«) = 0,9. Die Berechnung mit Excel erfolgt 
durch die Funktion F!VERT(2,3640;13;9; 1). 

Bei der inversen Vorgehensweise kann über die Funktion F.INV (vgl. Abb. 4.31) für 
eine gegebene kumulierte Wahrscheinlichkeit p = (1 — «) und für gegebene Freiheits- 
srade der entsprechende kritische F-Wert berechnet werden. So ergibt die Funktion 
F.INV(0,9;13;9) für eine kumulierte Wahrscheinlichkeit von p = 0,9 beim = 13 und 
n = 9 Freiheitsgraden den F-Wert F13:9.90% = 2,3640. 
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Angabe des F-Wertes (Quantil) der Verteilung (f=2,3640). 





Furt = Anzahl der Freiheitsgrade im Zähler (m=13). 
an a = = E ve is | Anzahl der Freiheitsgrade im Nenner (n=9). 
Treiheitsgradun 9 = Kumuliert=1 (WAHR): Liefert die kumulierte 
Kunulert |1 Bi = wor Wahrscheinlichkeit p. 
Gibt Varta der Verinkungsfunktion (1- Alpha) sine [Inkssetigen] F-verteiten Ze I | Ergebnis: Die kumulierte Wahrscheinlichkeit p=0.90. 
Kummer! ri in Wahre, der dee Bunikan Furuckgeben soll; de kurrulale 
Verbiienglusktiön = WAHR; de Wahrchencheraerunkton = FALSCH 
Formeergebnii m DEN 
Hilfe Für as Punsktiarı | Abbrechen 
Syntax: F.VERT(x;Freiheitsgrade m; Freiheitsgrade n;kumuliert); F-VERT(2,3640; 13;9;1) 
Fan Angabe der kumulierten Wahrscheinlichkeit p=(1-0)=0,9 
ze = = Anzahl der Freiheitsgrade im Zähler (m=13). 
Frehsitsgracel 1) A 1} 
Freiheitsgraden 3 Fi Anzahl der Freiheitsgrade im Nenner (n=9). 
bt Firrzuntiie der (Anksseitigen] F-Vertetlung zurück: wer = FVERTI.L ns ur Ergebnis: Kritischer f-Wert (Quantil): F 3.9.90 2.3640. 


Freiheitsgrade? it die Arızahl der Freifssisgrade am Haren, eine Zahl größer als oder gleich 1 
url khearser abs 1010 


Formeebergeinie u SERHLEBEL 


Bit. diese Fiktion [0] | Armeen 
Syntax: F.INV(Wahrsch;Freiheitsgrade m; Freiheitsgrade n); F.INV (0,9;13;9) 





Abb. 4.31 Berechnung der F-Verteilung mit Excel 


4.3.3.2 Berechnung der F -Verteilung mit Stata 

In Abb. 4.32 sind die Berechnungen der F-Verteilung mit Hilfe der Stata-Syntax zu- 
sammengefasst. Mit Hilfe der Syntax display invF(m,n,p) erfolgt die Berechnung des 
kritischen F-Wertes unter der Annahme einer gegebenen kumulierten Wahrschein- 
lichkeit op = (1 - «) bei m bzw. n Freiheitsgraden. So ergibt die Funktion display 
invF(13,9,0.9) fürp = 0,9beim = 13 undn = 9 Freiheitsgraden den F-Wert 
F\13:9:90% = 2,3640. 


Berechnet den Wert der kulminierten Wahrscheinlichkeit für p bei gegebe- display F(m,n/f) 
nem (kritischen) F-Wert und m bzw. n Freiheitsgraden. 


Bsp.: Für F=2,364 ergibt sich bei m=13 und n=9 Freiheitsgraden eine kulmi- display F(13,9,2.364) 
nierte Wahrscheinlichkeit p=0.89999872. ‚89999872 


Berechnet den (kritischen) F-Wert unter der Annahme einer gegebenen display invF(m,n,p) 
kulminierten Wahrscheinlichkeit p beim bzw. n Freiheitsgraden. 


Bsp.: Für p=0,9 ergibt sich bei m=30 und n=9 Freiheitsgraden ein F-Wert von | display invF(13,9,0.9)) 
F13,9,90%=2,364.0. 2.3640118 





Abb. 4.32 Berechnung der F-Verteilung mit Stata 
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Im umgekehrten Fall ermittelt display F(m;n,f) den Wert der kumulierten Wahrschein- 
lichkeit für p = (1 - «). So ergibt die Funktion display F(13,9,2.364) für den kritischen 
F-Wert F = 2364 bei n = 30 Freiheitsgraden die kumulierte Wahrscheinlichkeit von 
p=(1-e)=0.9. 


4.4 Übungsaufgaben zu Zufallsvariablen und 
Wahrscheinlichkeitsverteilungen 


Aufgabe 13 
An einem Bahnhof fährt die S-Bahn exakt alle 15 Minuten ab. Wie groß ist die Wahr- 
scheinlichkeit, dass ein zufällig eintreffender Fahrgast mehr als 10 Minuten warten muss? 


Aufgabe 14 

Getreu der Just-in-Time-Devise, dass Zulieferer flexibel und kurzfristig reagieren sollen, 
hält ein Automobilzulieferer nur eine geringe Anzahl von Einspritzpumpen auf Lager. 
Bei Bedarf wird dem Zulieferer eine telefonische Order übermittelt. Spätestens a Stunden 
nach der Bestellung sind die Einspritzpumpen im PKW-Werk. Innerhalb dieser a Stunden 
schwankt die Lieferzeit x gemäß der Dichtefunktion: 


—-— I 0<sx<sa 


” (4.56) 
sonst 


Ka) = 


OO ul 


a. Wie groß ist a? 

Zeichen Sie die Dichtefunktion! 

Bestimmen Sie P2 <X <4), PI<X <5), P(X >26), PX =2)und P(X <4) 
mit Hilfe der Dichtefunktion! 

Wie lautet die zugehörige Verteilungsfunktion? 

Zeichnen Sie die Verteilungsfunktion! 

Bestimmen Sie die Wahrscheinlichkeiten aus c) mit Hilfe der Verteilungsfunktion! 
Zeigen Sie den Zusammenhang zwischen Dichte und Verteilungsfunktion mit Hilfe 
Ihrer Zeichnungen! 


ee 


m ma A 


h. Bestimmen und interpretieren Sıe dıe Perzentile xo.25; Xo,5 und X0,75 sowie den Quar- 
tilsabstand! 

1. Wie können Sie diese Werte grafisch bestimmen? 

j. Wie lauten Erwartungswert, Varianz und Standardabweichung der Lieferzeit? 


Aufgabe 15 
Der Student Erwin möchte sein Auto starten. Er weiß, dass die Batterie mit einer Wahr- 
scheinlichkeit von 98% in Ordnung ist und dass die vier Zündkerzen jeweils mit einer 


4.4 Übungsaufgaben zu Zufallsvariablen und Wahrscheinlichkeitsverteilungen 89 


Wahrscheinlichkeit von 95 % funktionieren. Ihm ist bekannt, dass sein Auto genau dann 
anspringt, wenn die Batterie und mindestens drei Zündkerzen funktionieren. Alle Ereig- 
nisse sind paarweise unabhängig. Wie groß ist die Wahrscheinlichkeit, dass sein Auto 
anspringt? 


Aufgabe 16 

Von allen Wirtschaftswissenschaftlern der FH Pforzheim waren 45% schon einmal in 
Spanien (mit Balearen und Kanarischen Inseln), 23% schon einmal ın Portugal. 11% 
waren bereits sowohl ın Portugal als auch in Spanien. 


l. Mit welcher Wahrscheinlichkeit war ein beliebig herausgegriffener Wirtschaftswissen- 
schaftler bereits auf der Iberischen Halbinsel (bestehend aus Spanien und Portugal)? 

2. Mit welcher Wahrscheinlichkeit waren von 5 beliebig herausgegriffenen Personen 
mindestens zwei schon in Spanien oder Portugal’ 


Aufgabe 17 

Bei einer Lieferung von N Fernsehern sind M nur zweite Wahl. Um den Anteil der Fern- 
seher zweiter Wahl zu schätzen, wird eine Stichprobe vom Umfang n gezogen. Welche 
Verteilung für die Anzahl der Fernseher zweiter Wahl ergibt sich, wenn 


a. mit, 

b. ohne Zurücklegen gezogen wird’? 

c. Wie groß ist beim Ziehen ohne Zurücklegen die Wahrscheinlichkeit, dass bei N = 15, 
M =5undn = 3 mehr als ein Fernseher zweite Wahl ist? 


Aufgabe 18 

Von den 25 Arbeitnehmern eines mittelgroßen Geschäftes sind fünf mit längeren La- 
denöffnungszeiten einverstanden. Ein Journalist befragt für eine Dokumentation über die 
Einstellung zu einer Änderung der Öffnungszeiten sechs Angestellte, die er zufällig aus- 
wählt. 


a. Wie groß ist die Wahrscheinlichkeit, dass sich keiner der Befragten für längere Öff- 
nungszeiten ausspricht? 

b. Wie groß wäre die Wahrscheinlichkeit, wenn die Arbeitnehmer ‚mit Zurücklegen“ be- 
fragt worden wären? 


Aufgabe 19 
Bei der Herstellung eines Werkstückes beträgt der Ausschussanteil 69 = 0,01. Aus der 
laufenden Produktion wird nun zufällig eine Stichprobe vom Umfang n = 100 gezogen. 


Bestimmen Sie die Wahrscheinlichkeit dafür, dass sich in der Stichprobe höchstens ein 
defektes Stück befindet! 
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Aufgabe 20 
Die pro Minute in einer Telefonzentrale ankommenden Anrufe sind Poisson-verteilt mit 
X = 2. Bestimmen Sie die Wahrscheinlichkeiten dafür, dass in einer bestimmten Minute: 


a. kein Anruf erfolgt; 
b. höchstens zwei Anrufe erfolgen. 


Aufgabe 21 

Die Firma „Compsolutions“ hat 40 Mitarbeiter. Von diesen sind 20 % in der Gewerkschaft 
und würden einen Streik im kommenden Arbeitskampf unterstützen. Die Marketingabtei- 
lung von Herrn Schaffig besteht aus 6 Mitarbeitern. Wie groß ıst Herr Schaffigs Chance, 
dass seine gesamte Abteilung gegen den Streik ist und im Falle eines Streiks weiterarbei- 
tet? 


Aufgabe 22 

In der Buchhaltung einer Firma erledigt ein Sachbearbeiter pro Tag 500 Buchungen. Die 
Wahrscheinlichkeit eines Fehlers bei einer Buchung betrage 0,004. Wie groß ist die Wahr- 
scheinlichkeit für mehr als eine Fehlbuchung pro Tag’? 


Aufgabe 23 

An einer Kreuzung wird an zwei Punkten eine Verkehrszählung durchgeführt. Die An- 
zahl der pro Minute passierenden Kraftfahrzeuge ist Poisson-verteilt mit Aı = 1,2 und 
A2 = 0,8. Wie groß ist die Wahrscheinlichkeit, dass innerhalb von 5 Minuten höchsten 6 
Fahrzeuge den Beobachtungspunkt passieren’? 


Aufgabe 24 

Die Firma „Hedonic“ ist mit ausreichend Kaffeeautomaten ausgestattet. Der Kaffeever- 
brauch der 100 Mitarbeiter ist normalverteilt mit einem Erwartungswert von 130 1/ Woche 
und einer Standardabweichung von 5 1/ Woche. 


a. Mit welcher Wahrscheinlichkeit reichen 135 Liter Kaffee pro Woche aus’? 
b. Die Betriebsleitung möchte, dass die Kaffeemenge mit 95 % Wahrscheinlichkeit aus- 
reicht. Wie vıel Liter Kaffee muss sie dann pro Woche bereithalten? 


Aufgabe 25 

Die Masse von Küken gleichen Alters und Art beträgt durchschnittlich 105g bei einer 
Standardabweichung von 2,5 g und ist normalverteilt. Wie groß ist die Wahrscheinlichkeit, 
dass die Masse der Küken 


a. weniger als 100 g beträgt” 
b. mehr als 101 g und weniger als 108 g beträgt? 
c. Welche Masse unterschreiten 40 % der Küken? 


4.4 Übungsaufgaben zu Zufallsvariablen und Wahrscheinlichkeitsverteilungen 91 


Aufgabe 26 

Eine Maschine füllt Kaffeepakete so, dass das Gewicht des eingefüllten Kaffees normal- 
verteilt ist mit u = 510g und o = 208. Die Pakete sind mit „Füllgewicht : 500 Gramm“ 
beschriftet. 


a. Wie viel Prozent der Pakete sind untergewichtig? 

b. Wie viel Prozent der Pakete wiegen mehr als 550 g? 

c. Wie groß müsste u bei gleicher Standardabweichung sein, damit nur 1% der Pakete 
untergewichtig wären? 


Aufgabe 27 

Das Unternehmen Autotrans hat sich auf den Transport von Fahrzeugen zwischen Produk- 
tion und Händler spezialisiert. Sehr selten kommt es beim Transport zu Beschädigungen 
an einem Fahrzeug. Pro Monat treten im Mittel Beschädigungen an 1,21 Fahrzeugen auf. 
Die Standardabweichung der Beschädigungen beträgt 1,1 Fahrzeuge. 


a. Wie groß ıst die Wahrscheinlichkeit, dass es in einem Monat zu drei Beschädigungen 
kommt? Geben Sie bitte an, welche Verteilungsannahme Sie warum zugrunde legen! 

b. Wie groß ist die Wahrscheinlichkeit für 16 Beschädigungen in 12 Monaten? 

c. Wie groß ist die Wahrscheinlichkeit für zehn bis 20 Beschädigungen in 12 Monaten? 
Begründen Sie, weshalb Sıe nun eine andere Verteilungsannahme treffen können und 
sollten! 


Aufgabe 28 

Ein Händler möchte zu Silvester 25 Feuerwerkskörper aus dem letzten Jahr loswerden. 
Der Hersteller garantiert nach einem Jahr die Funktionsfähigkeit von 60 Prozent der Feu- 
erwerkskörper (also 15 Stück). Wir wollen an dieser Stelle annehmen, dass die Funkti- 
onsfähigkeit der Feuerwerkskörper nicht unabhängig voneinander und damit hypergeo- 
metrisch verteilt ist. Ein Kunde kauft fünf der 25 Feuerwerkskörper. 


a. Wie groß ist die Wahrscheinlichkeit, dass lediglich ein Feuerwerkskörper funktioniert? 

b. Angenommen der Händler hätte nun noch 1000 Feuerwerkskörper auf Lager und ein 
Kunde würde davon 50 abnehmen. Die Funktionsfähigkeit würde wieder für 60 % 
der Feuerwerkskörper garantiert. Welche Verteilung würden Sie annehmen, um die 
Wahrscheinlichkeit zu bestimmen, dass eine bestimmte Anzahl von Feuerwerkskör- 
pern funktioniert, wenn Ihr Taschenrechner bei der Berechnung der eigentlich ange- 
messenen Verteilung versagen würde? Begründen Sie Ihre Aussage. Eine Berechnung 
braucht an dieser Stelle nicht zu erfolgen. 


Aufgabe 29 
Ein Großhandel beliefert täglich 50 Einzelhändler. Die Wahrscheinlichkeit einer Reklama- 
tion ist sehr selten und beträgt bei allen Einzelhändlern (unabhängig voneinander) 0,03. 
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a. Wie groß ist die Wahrscheinlichkeit, dass genau ein Einzelhändler eine Reklamation 
hat? 

b. Wie groß wäre die approximative Wahrscheinlichkeit von genau 10 Reklamationen, 
wenn der Großhandel 300 Einzelhändler beliefern würde? 


Aufgabe 30 
Es liegt eine maschinelle Produktion vor. 


a. Aus Erfahrung weiß man, dass die Wahrscheinlichkeit, dass während eines Tages kein 
Fehler auftritt 0,9048 beträgt. Welche Verteilung eignet sich zur Beschreibung der Zu- 
fallsvariablen X = Anzahl der Fehler, die während eines Tages auftreten? Bestimmen 
Sie den Wert des Parameters dieser Verteilung. 

b. Wie groß ist die Wahrscheinlichkeit, dass bei vier (voneinander unabhängigen) Ma- 
schinen desselben Typus während eines Tages genau ein Fehler auftritt? 


4.5 Lösungen der Übungsaufgaben 
Lösung 13 


Die Wartezeit ist gleichverteilt mit f(x) = 50 =x=< 19; 
Die Wahrscheinlichkeit, dass ein Zug in den nächsten 10 Minuten kommt, beträgt: 








x=10 
l x—-d 10 — 0 2 
F = d == = —ı —, 
5 Br “no 50 3 
a 


Die Wahrscheinlichkeit, dass ein Zug ın den nächsten 10 Minuten nicht kommt, beträgt: 


2 1 
l-F&)=1--=-. 
(x) -. 


Lösung 14 


a a 
l x A ii © 
eo ed 
[G n) E (: =) 5 100 
0 0 
> a? - 20a + 100 =0 = aıp = 10+ 100 - 100 
a = 10 — V100 — 100 = 10 
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b. 
x f(x) F(x) 
0 0,2 0 f{x)=1/5 - x/50 
1 0,18 0,19 
2 0,16 0,36 
3 0,14 0,51 
a 0,12 0,64 
5 0,1 0,75 
6 0,08 0,84 
7 0,06 0,91 
8 0,04 0,96 
9 0,02 0,99 
10 0 1 
c. 
E 4 
1 x x x 4 16 2 4 
5 50 5 100 ) |, 5 100 5 100 
2 
— 0,28 
2 5 
1 x ei 25 1 1 
PI=ZX<ede ze dreh =.) ejen elle 
5 50 5 100 / |, 100 3 100 
1 
— 0,56 
10 10 
1 x x x 6 36 
P(X 26) = eo Il = =2-1-|(|-- — |=0,16 
5 50 5 100 5 100 
6 6 
, l 
PX=2=| ı dx = 
5 50 
2 
4 4 
l x x x 4 16 
P(X<4)= ne —- I <-— — - — — = (0,64 
5 50 5 100 3 100 
0 0 
d. 
0 x<0O 
x 
F — “(1 _u\gd = (5-5) Se 0<x<10 
(x) 0 (3-5) du sm), 570 "SR 
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fe. PR <X <A4 = F(4) - FQ) = 0,64 - 0,36 = 0,228; PII<X <5) = F(5) - 
F(l) = 0,75 — 0,19 = 0,56; P(X >6) =1-F(6) = 1- 0,84 = 0,16; P(X = 
2) = FR) - FR) =0; P(X <4) = F(4) = 0,64. 

g. Die Verteilungsfunktion gibt die Fläche unter der Dichtefunktion bis zur Stelle x an. 
Die Dichtefunktion gıbt die Steigung der Verteilungsfunktion an der Stelle x an. Da- 
raus folgt: Durch Integrieren der Dichtefunktion erhält man die Verteilungsfunktion 
und durch Ableiten der Verteilungsfunktion erhält man die Dichtefunktion. 


= e Xp X z 2 u 
Paaren 27 nr 


> x = 10 + 100 - 100p > x, = 10 — Y 100 — 100p 
x025 = 10 — y 100 — 100 0,25 = 1,34 
xo5 = 10 — Y100 - 100 0,5 = 2,93 
x075 = 10 — Y 100 - 1000,75 =5 


OA = 057.903 - 5 — 1,34 = 3,66 


1. Mit Hilfe der Umkehrfunktionen von F(x). 


]. 
2 1 2 3 
EX) = [x SE — An. 
> 50 10 150 
0 


10 


„_ 1900 _ 10 
En 150 3° 
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Berechnung der Varianz mit Hilfe des Verschiebungssatzes: 


Var(X) = E[(X - E(X))*] = E(X°) - E(X)”. 





10 
s (1 x 3 x*\|” 1000 10.000 200 
Beer Ne 
5 50 15 200) |, 15 200 3 
0 
50 
3 
50 /10\° 150-100 50 
varX)= (7) = =, 799-0 = YVarlX) = 2,36 
Lösung 15 


Ereignisse: B: Batterie funktioniert; Z: mindestens 3 Zündkerzen funktionieren; A: Auto 
springt an 

Die Wahrscheinlichkeit, dass das Auto anspringt ist wegen der Unabhängiskeit der 
Ereignisse gegeben durch: P(A) = P(ZN B) = P(B)P(Z) = 0,98 P(Z) 

Für die Bestimmung von P(Z) definiere die Zufallsvariable X = Anzahl der funktio- 
nierenden Zündkerzen. Damit ist P(Z) = P(X =3)+ P(X =4). 

Die Zufallsvariable X ist wegen der Unabhängigkeit der Ereignisse binomialverteilt 
mitn = 4und p = 0,9. 


! 
—0,95° . 0,05! = 4 0,857 - 0,05 = 0,171 





4 
P(X=3)= (4)0> 0,05! = IST 


4 
PX=MN)= (1)ss -0,05° = 0,815. 


P(Z) ergibt sich damit als: P(Z) = P(X =3) + P(X = 4) = 0,171 + 0,815 = 0,986. 
Die Wahrscheinlichkeit, dass das Auto anspringt, ist: 
P(A) = P(ZNB) = P(B)P(Z) = 0,98: P(Z) = 0,98 : 0,986 = 0,96628. 
Lösung 16 
l. Sei A das Ereignis „Student war bereits in Spanien“, B das Ereignis „Student war be- 
reits in Portugal“. Dann bedeutet P(A U B), dass der Student schon einmal in Spanien 


oder Portugal war. Nach dem Additionssatz gilt: 


P(AUB)= P(A)+P(B)- P(ANB) = 0,45 + 0,23 - 0,11 = 0,57 
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2. X sei die Anzahl der Personen, die schon einmal in Spanien oder Portugal gewesen 
sind. Es liegt eine Binomialverteilung X > B(5; 0,57) vor. Es gilt: 


PX>2YD=PX=2)+PX=3)+P(X=M)+P(X=5) 
-1-PX=0)-P(X=1) 


5 5 
PX>2)=1- ()e” . 0,43? — (os . 0,43? = 1 — 0,0147 — 0,0974 
— 0,8879 
Lösung 17 


a. Binomialverteilung; 
b. Hypergeometrische Verteilung; 
ee 


120 5-45 


Pı\ıele1-=- /’ tt <I)e Terre 1-1, nn 
&X>1) X <1) .@ (+5 


j —= 0,24175 
Lösung 18 

Definiere die Zufallsvariable X = Anzahl der Angestellten in der Stichprobe, die für 
längere Öffnungszeiten sind. Weiterhin seien: N: Anzahl aller Objekte = 25; M: Anzahl 
Objekte mit bestimmter Eigenschaft = 5; n: Anzahl der Ziehungen = 6; x: Anzahl 
Objekte mit bestimmter Eigenschaft in den Zıehungen = 0 


a. Hypergeometrische Verteilung: 


BE (*) (7) 177,100 








n 


b. Binomialverteilung: 
6\/5\ N : 
PX =0 = — 1-— |] =0,85° = 0,262 
0/\25 25 


100 100 
PX <= PX =0)tPX=j1)= ( ; 0.010999 4 ( )oor . 0,99” 


Lösung 19 


— 0,3660 + 0,3697 = 0,7357 
oder über Approximation mit der Poisson-Verteilung A = n-6 = 100:.0,01 = 1 


let 1le-l 


a + op = 0,3679 + 0,3679 = 0,7358 








P(X <1)= 
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Lösung 20 
a. Bes 
.- 
P(X =0) = n, = e”? = 0,1353 
b. 


2e2 5 Mor Der: 


PX<D)=PX=V)+PX=)+PX == 1 +75 











=, 33302707 FV 2707 = 0;6767 


Lösung 21 

Definiere die Zufallsvariable X = Anzahl der Mitarbeiter, die streiken würden. 
Weiterhin seien N: Anzahl aller Objekte = 40; M: Anzahl Objekte mit bestimmter 

Eigenschaft = 8; n: Anzahl der Ziehungen = 6; x: Anzahl Objekte mit bestimmter 

Eigenschaft in den Ziehungen = 0. 


Ä nsı EN) N 
Hypergeometrische Verteilung: 7 (40, 8,6,0) = () = m 0.236 
n 6 
Lösung 22 
Es handelt sich um eine seltenes Ereignis (P = 0,004). Es kann von einer Poisson- 


Verteilung ausgegangen werden. Definiere die Zufallsvariable X = Anzahl der Fehlbu- 
chungen pro Tag. 
Poisson-Verteilung: P(X =x) = Ze 
=E(X) =n-p = 500-0,004 = 2 
„0 J1 
PX>1)=1-PX=0)-P(X=1)= a ren — 59,4% 
Lösung 23 
ReproduktivitätX = Aı +42 = 1,2 + 0,8 = 2 Fahrzeuge pro Minute und nochmalige 
Anwendung der Reproduktivität für jede Minute: 5-2 = 10 Fahrzeuge pro 5 Minuten. Wie 
groß ıst die Wahrscheinlichkeit, dass innerhalb von 5 Minuten höchsten 6 Fahrzeuge den 
Beobachtungspunkt passieren? Mit der Poisson-Verteilung entspricht dies den addierten 
Poisson-Wahrscheinlichkeiten für 0, 1, 2, 3, 4, 5 und 6 Fahrzeuge: 


a 106 
PX<6)=) er — Zettel, 
X: | 
i=0 


Über Normalverteilung, wenn A > 10: N(w: u”) = N(10; 10%) 


P(x < 6,5) =Z (Z) = zZ >) -ZAIadei2 Zi) 


= 1-0, 8665 =W0.13, 
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An dieser Stelle wird der Wert 6,5 als Obergrenze gewählt, da in diesem Fall die diskrete 
Poisson-Verteilung durch eine stetige Normalverteilung approximiert wird. Das bedeu- 
tet, dass alle Werte der stetigen Verteilung zwischen 6 und 6,5 noch als diskreter Wert 6 
aufgefasst werden. Dies nennt man „Stetigkeitskorrektur“! 


Lösung 24 
Definiere die Zufallsvariable X = Kaffeeverbrauch in 1/Woche; X » N (130,5) 


a. 
X —-130 _ 135 — 130 135 — 130 
P(X < 135) = P( —— < ———)\= pP (z< —— 
5 5 5 
> P(Z <1) = ®(l) = 0,8413 
b. 
x — 130 
PX ZEV IS S P2 IH) I 53 ZH 1:65.22 x = 173825 
Lösung 25 


Es ist P(X < 100g) zu ermitteln. Dazu ist die Zufallsvariable X zuerst auf eine standard- 
normalverteilte Zufallsvariable Z zu transformieren. Es gilt: 


a. 2,28% der Küken wiegen weniger als 100 g: 
X — 105 F 100 — 105 
Di 2,5 
= 1-0 72 =. 3 = 223% 


Pix < 100) = P ( )-P@<-D-1-Piz=2 


2,5 70707025 
—- P(Z<12)- P(Z<-1,6) 
= P(Z<12)-(1-P(Z <1,6)) = 0,8301 


X — 101 100 — 108 
P(I101<X<1089) = P| ——— <Z <s —— 


c. PX <c)=0,4. 
Für die standardnormalverteilte Zufallsvariable Z gilt: P(Z < re) = 0,4 
Da nur Werte größer-gleich 0,5 tabelliert sind, ist: P(Z < rn —):6 
Für das 60 %-Quantil liest man ungefähr 0,255 ab. Es gilt: -— = = 0,255 


25 
Nach Umstellung ergibt sich: c = 105 + 2,5 - 0,255 = 104.3625 


Lösung 26 
a. Es ist P(X < 500g) zu ermitteln. Dazu ist die Zufallsvariable X zuerst in eine stan- 


dardnormalverteilte Zufallsvariable zu transformieren (z-Transformation): 


X — 150 
208 
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Damit erhält man: P(X < 500g) = Pe. zZ ) = F(-05) = 1- 
F(0,5) = 1 - 0,6915 = 0,3085. 
D.h. 30,85 Prozent der Pakete sind untergewichtig. 


X —5508 5 550-5108 


Pre Ssep 
(X > 5508) ( 20 — MU 


i = 1-F(2) = 1-0,9772 = 0,0228 


c. Es muss gelten: 


X-u _5008- 5008 - 
Passo ep 2, =, 
208 208 208 


Da nur Werte größer oder gleich 0,5 tabelliert sind, ıst 


5008 — 5008 — 
je FI Io 7,2088 
208 208 


Daher ergibt sich: u — 2,326, da 2,326 das 99 %-Quantil der Standardnormal- 
verteilung und damit —2,326 das 1 %-Quantil der Standardnormalverteilung darstellt. 
Umstellen ergibt u = 546,52 8. 


Lösung 27 


a. Definiere die Zufallsvariable X = Beschädigungen pro Monat. Es handelt sich um ein 
seltenes Ereignis. Die Zufallsvariable X ist deswegen Poisson-verteilt: 


x 


A 
PX=x)= Te mit =E(X) = 1,21. 
X: 


Ar 97 
Ps) ver en 
x! 3! 


— 8,80%. 
b. Definiere die Zufallsvarıable Y = Beschädigungen pro Jahr. Aufgrund der Reproduk- 
tivität gilt: 
=E(Y) = 12: 1,221 = 14,52. 


Die Wahrscheinlichkeit für 16 Beschädigungen in 12 Monaten beträgt 


” ._ 1452 uam 


P(Y = 16) = —e = DR: 
y! 16! 
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c. Es müssten 11 Einzelwahrscheinlichkeiten berechnet werden. Approximation durch 
Normalverteilung ist einfacher und da E(Y) > 10 auch möglich. 


E(Y) = 14,52; Var(Y) = 14,52; 0 = 3,811; y, = 9,5; yo = 20,5 
P9,5<Y <205) = P(Y < 20,5) - P(Y < 9,5) 
20,5 — 14,52 9,5 — 14,52 
zZ DZ. 
3,811 3,811 
P9,5<Y <205) = P(Z < 1,569) - P(Z < -1,317) 
P(,5<Y < 20,5) = ®(1,569) - [1 - ®(1,317)] = 0,9418 — [1 — 0,9066] 
— 0,8484. 


An dieser Stelle werden die Werte 9,5 bzw. 20,5 als Grenzen gewählt, da in diesem 
Fall die diskrete Poisson-Verteilung durch eine stetige Normalverteilung approximiert 
wird. Das bedeutet, dass alle Werte der stetigen Verteilung zwischen 9,5 und 20,5 noch 
als diskrete Werte zwischen 10 und 20 aufgefasst werden. Dies nennt man „Stetigkeits- 
korrektur“! 


Lösung 28 


a. Definiere die Zufallsvariable X = Anzahl der Feuerwerkskörper, die funktionieren. 
Weiterhin seien N: Anzahl aller Objekte = 25; M: Anzahl Objekte mit bestimmter 
Eigenschaft = 15; n: Anzahl der Ziehungen = 5; x: Anzahl Objekte mit bestimmter 
Eigenschaft in den Ziehungen = 1. Es liegt eine hypergeometrische Verteilung vor: 


H023.13.>5,.1,= lea _ am 


b. Approximation Normalverteilung da M/N zwischen 0,1 und 0,9 und n > 30: 


ver: ll) 11,4). 


en 








Lösung 29 


a. Definiere die Zufallsvariable X als Anzahl der Reklamationen: 
ee FO ir 50-1 _ 
P(X=])= 1 p’1-p) = ı 0,03° - (1 — 0,03) = 53,72%. 


Berechnung auch über Approximation mit Hilfe der Poisson-Verteilung möglich, da 
n-p=50-0,03 < IOundn < 1500. p = 1500 - 0,03 = 45: 


* x 1° 


e |? = 33,47%. 
x! x! l! 


Literatur 101 


b. (75) 2". (1 p)°!0 = 12,04% (Rechnet der normale Taschenrechner in der Regel 


nicht.) 
Dan-p = 300 -0,03 = 9 < 10 und 1500 - p = 1500 - 0,03 = 45 < n = 300 erfolgt 


eine Approximation durch die Poisson-Verteilung mtA =E(X)=n-p= 9: 


X 10 
P(X = 10) = —e” = —e” = 11,85%. 
x! 10! 
Lösung 30 
a. Zufallsvariable X = Anzahl der Fehler pro Tag: 
A Ar 
P(X =0) = —e” = re -0,08 2X =0, 
x! | 


b. Definiere Zufallsvariable Z = Anzahl der Fehler pro vier Maschinen pro Tag: 


4.0,1)? 0,4)! 2: 
= 401-401 = 04 ‚-0 — 0,268 (Reproduktivität) 
z 


nem) | 1! 
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Parameterschätzung 


Nachdem in den letzten Kapiteln die theoretischen Grundlagen der Wahrscheinlichkeits- 
rechnung gelegt worden sind, wollen wir uns an dieser Stelle daran zurückerinnern, wozu 
wir uns dieser Mühe unterzogen haben. Die wesentliche Aufgabe der Induktiven Statistik 
ist es, Methoden und Verfahren zu entwickeln, mit denen sich die Ergebnisse einer Stich- 
probe auf die Grundgesamtheit übertragen lassen. Durch ein statistisches Schätzverfahren 
soll mittels einer Stichprobe ein unbekannter Parameter der Grundgesamtheit - z.B. das 
mittlere Alter — geschätzt werden. Man unterscheidet dabei zwischen Punkt- und Inter- 
vallschätzungen. 

Mit Punktschätzungen (engl.: point estimation) lassen sich beispielsweise Mittelwerte 
(E(x) oder u) oder Varianzen (Var(x) oder o) einer Grundgesamtheit durch die entspre- 
chenden Stichprobenmittelwerte x oder 5 * schätzen. „Der durchschnittliche Preis eines 
Konkurrenzproduktes liegt bei 2,38 Euro“ wäre ein typisches Beispiel für eine Punktschät- 
zung. Natürlich ist es auch hier wıe immer im Leben: Je bestimmter man sich auf einen 
festen Wert festlegt, umso größer ist auch die Wahrscheinlichkeit, mit seiner Schätzung 
daneben zu liegen. Vielleicht liegt der Durchschnittspreis ja bei 2,39 Euro oder gar bei 
2,40 Euro? Aus diesem Grund ist es nicht selten ratsam, Schätzungen in Form eines Inter- 
valls anzugeben. Man spricht dann von sogenannten Intervallschätzungen (engl.: interval 
estimation). „Mit 99 %-iger Sicherheit liegt der Durchschnittspreis eines Konkurrenzpro- 
duktes zwischen 2,36 und 2,40 Euro“ gibt beispielsweise das Intervall an, in dem mit 
gegebener Sicherheit der wahre Preis der Grundgesamtheit liegt. Eine Intervallschätzung 
ist dabei letztlich nichts anderes als eine Punktschätzung, die um einen mehr oder weni- 
ger großen „Fehlerspielraum“ (engl.: margin of error) erweitert wird. Die Größe dieses 
Spielraumes hängt dabei u. a. von der gewünschten Sicherheit ab: Je sicherer ein Ergebnis 
sein soll, umso größer muss das Intervall gesetzt werden. Wir werden uns im Folgenden 
zunächst mit Punktschätzungen als Grundlage für eine Intervallschätzung befassen. 


© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 103 
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5.1 Punktschätzung 


Nehmen wir einmal an, dass wir eine einfache Zufallsstichprobe mit dem Umfang n zie- 
hen und für die uns interessierende Variable (z.B. den Preis einer neuen Joghurtsorte) 
die durchschnittliche Ausprägung x ermitteln. Können wir nun davon ausgehen, dass 
der so ermittelte Durchschnittswert dem tatsächlichen Mittelwert der Grundgesamtheit u 
entspricht? Sicherheitshalber könnten wir den gesamten Vorgang nochmals wiederholen 
und eine weitere Stichprobe ziehen. Sollten die Werte der beiden Stichprobenmittelwer- 
te xı und x» dicht beieinander liegen, können wir tendenziell davon ausgehen, dass die 
Stichprobenmittelwerte gute Schätzungen für den tatsächlichen Mittelwert der Grundge- 
samtheit sind. Dennoch werden x| und x> nur selten tatsächlich einen identischen Wert 
annehmen und den genauen Wert von u treffen. Um ganz sicher zu gehen, würden wir 
theoretisch unendliche viele Stichproben (mit Zurücklegen) ziehen. Diese Stichproben 
werden sich fast immer hinsichtlich ihres Stichprobenmittelwertes x unterscheiden. Alle 
Werte für x ergeben aber eine sogenannte Stichprobenverteilung (engl.: sampling distribu- 
tion), deren Streuung Auskunft darüber gibt, wie gut ein einzelner Stichprobenmittelwert 
den unbekannten Mittelwert einer Grundgesamtheit u schätzt: Je geringer die Streuung 
der Stichprobenverteilung, desto genauer ıst die Schätzung durch den Stichprobenmit- 
telwert x. Die Genauigkeit unserer Schätzungen ist also aus der Stichprobenverteilung 
ableitbar. Sollte uns die Stichprobenverteilung also bekannt sein, könnten wir Aussagen 
über die Genauigkeit unserer Schätzung machen. Es macht deshalb Sinn, sich mit den 
Besonderheiten von Stichprobenverteilungen genauer zu beschäftigen. 

Eine erste intuitive Idee könnte es sein, davon auszugehen, dass die Verteilung des 
Mittelwertes der Stichprobe auch der Verteilung der empirischen Grundgesamtheit der 
interessierenden Variablen entspricht. Wird also aus einer normalverteilten Grundgesamt- 
heit eine Stichprobe gezogen und hieraus danach der Mittelwert berechnet, so würden 
wir erwarten, dass bei oftmaliger Wiederholung dieses Prozesses der Stichprobenmit- 
telwert ebenfalls normalverteilt ist. Dies wollen wır anhand eines praktischen Beispiels 
überprüfen: Angenommen es liegt in einer gegebenen Grundgesamtheit eine normalver- 
teilte Altersstruktur mit einem tatsächlichen Mittelwert von u = 35 Jahren und einer 
Standardabweichung von o = 10 Jahren vor (vgl. Abbildungsteil 1 von Abb. 5.1). 

Beginnen wir nun mit dem Ziehen von Zufallsstichproben: Für eine erste kleine Stich- 
probe von n = 5 erhalten wir beispielsweise die Werte 31,46; 28,16; 44,62; 42,76; 34,41 
und damit einen Stichprobenmittelwert von x; = 36,28 Jahren. Es wäre ein glücklicher 
Zufall gewesen, wenn der Mittelwert aus einer Stichprobe von lediglich n = 5 genau den 
Mittelwert der Grundgesamtheit angenommen hätte. Dennoch liegt das Stichprobenmit- 
tel nicht weit vom wahren Wert der Grundgesamtheit u = 35 Jahre entfernt. Ziehen wir 
nun mehrfach hintereinander eine Stichprobe der Größe n = 5 und berechnen jeweils den 
Stichprobenmittelwert, so würden wir erkennen, dass sich die Mittelwerte der Stichproben 
um den wahren Wert der Grundgesamtheit verteilen. 

Der Einfachheit halber soll diese Aufgabe Excel für uns übernehmen: Sind in Excel 
mit dem Add-Ins-Manager die Module Analyse-Funktionen und Analyse-Funktionen-VBA 
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u =35;0 =4,43 

3000 

2500 

2000 


1500 


Häufigkeit 


1000 


500 


0 4 8 12 1 20 24 3 2 % 40 4 48 532 56 60 64 68 und 
älter 


Alter 
Abbildungsteil 1: Grundgesamtheit N(u=35; o=10)-verteilt 


200 
180 
160 
140 


z=35;0, =4,43 


Häufigkeit 
Hı- 
© N 
oO © 


0 A 8 2 16 20 24 2383 32 36 40 4 4 52 56 60 64 68 und 


Ai älter 
Abbildungsteil 2: Verteilung der Stichprobenmittelwerte aus 1000 Stichproben der Größe n=3. 


Häufigkeit 
m SS N 





0 4 8 2 6 20 24 2383 32 36 40 4 4 52 56 60 64 68 und 


älter 
Alter 
Abbildungsteil 3: Verteilung der Stichprobenmittelwerte aus 1000 Stichproben der Größe n=30. 


Abb. 5.1 Stichprobenmittelwertverteilung bei normalverteilter Grundgesamtheit 


dauerhaft aktiviert,' kann im Menüpunkt Daten die Schaltfläche Datenanalyse gewählt 
und die Funktion Zufallszahlengenerierung ausgewählt werden. Danach wollen wir 1000 


! Für Excel 2010 ist dieser über die Schaltflächenkombination Datei > Optionen — Add-ins — 
Gehe zu erreichbar. 
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Anzahl der zu generierenden 


"Zufallszahlengenerierung, Ta Stichproben. 
Anzahl arlablen: | 
se En x, Größe der Stichproben. 
Anzahl der Zufallszahlen: 5 Abbrechen | 
—— Verteilung der Stichprobe: 
Vertedung: Standard r) | Standard =Normalverteilung. 
Parameter Mittelwert der 
Mitelwert = 35 Grundgesamtheit. 


Standardabweichung = 10 
Standardabweichung der 








Grundgesamtheit. 
Ausgangswert: 
Auspale 
Ausgabebereich: A 

© Neuss Tabelenblatt: 

EEE 3%  eintügen Seitenlayout Formen Daten Überprüfen Ansicht Addins 
m # Calibri u «Ay me m. »- Zyp Zeilenumbruch Starıcard 
Ja = 
Einfügen 4 F£<U'  E- - 4 A- FH U HE Hieminden undzentrieren- io 
Zwischenablage 1 Schriftart x Ausriehäung z Zahl 
Al2 “( 5 

AP © | c | nm EHE 
1 Stichproben-Ar. 1 a 3 4 5 6 
2 31.46 21.80 49.25 27.05 40.34 43.29 
3 23.16 26.30 23.01 43.0 31.48 51.31 
ü 44.63 20.15 4i.38 45.98 27.23 39.40 
5 Ar TE 35.40 41.14 32.83 41.34 21.46 -=MITTELWERT(G2:G6) 
6 34.41 37.48 14.34 37.48 33.81 55.40 j 
3628 2019 2252 mal ass 4217| -MITTELWERT(B7:ALM7) 
& Mittelwert aller Stichproben 35.00 
9 Standardabweichung aller Stichproben a | =STABW.S(B7:ALM?) 


Abb. 5.2 Erzeugung von Stichproben mit Excel: Beispiel für 1000 Stichproben der Größen = 5 
aus einer N(35; 10)-verteilten Grundgesamtheit 


Stichproben der Größe n = 5 aus der oben spezifizierten Grundgesamtheit mit N(u = 
35,0 = 10) ziehen. In Abb. 5.2 ist die Vorgehensweise beschrieben. Die oben genannte 
Stichprobe 1 ist dabei den Zellen B2 bis B6 der Excel Tabelle entnommen (vgl. unteren 
Teil von Abb. 5.2). 

Insgesamt ergeben sich für die 1000 Stichproben (sıehe Spalte B bis Spalte ALM der 
Excel-Tabelle) in Zeile 7 sehr viele Stichprobenmittelwerte in der Nähe des wahren Mit- 
telwertes der Grundgesamtheit u = 35. Selten weichen die Stichprobenmittelwerte mit 
großen Ausschlägen nach oben oder nach unten ab. Dennoch kommen diese Fälle vor. 
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Erstellt man für die 1000 Mittelwerte nun ein Histogramm (vgl. Abbildungsteil 2 aus 
Abb. 5.1), so stellt man fest, dass die Stichprobenmittelwerte x um den wahren Mittel- 
wert der Grundgesamtheit u = 35 normalverteilt sind. Auffällig ıst allerdings auch, dass 
die Standardabweichung der Verteilung der Stichprobenmittelwerte kleiner ist als die der 
Grundgesamtheit. Im Durchschnitt ergibt sich eine Standardabweichung der Stichproben- 
mittelwerte von 05 = 4,43. Vergleicht man diesen Wert mit dem der Standardabweichung 
der Grundgesamtheit (o = 10), lässt sich folgender Zusammenhang herausarbeiten: Die 
Streuung der Stichprobenmittelwerte ergibt sich aus dem Quotienten der Standardabwei- 
chung der Grundgesamtheit und der Wurzel der jeweiligen Stichprobengröße. Diesen 
Parameter o> nennt man den Standardfehler (engl.: standard error) der Stichprobe: 


o 10 
O4 ——a Ze —— 
"on 55 


Werden also Stichproben der Größe n aus einer normalverteilten Grundgesamtheit mit 


— 4,47 4,43. 5.1) 


N(u;0o) gezogen, sind die Mittelwerte der Stichproben mit 
N (a: —) = N(u:05) (5.2) 
: = 0% 
MH Yn A x 


ebenfalls normalverteilt. Letztlich bedeutet dies aber auch, dass aus den beiden Stichpro- 
benparametern x und o; auf den Mittelwert und die Standardabweichung der Grundge- 
samtheit geschlossen werden kann. 

Es gilt dabei Folgendes: Je größer der Stichprobenumfang gewählt wird, umso schma- 
ler verläuft die Normalverteilung der Stichprobenmittelwerte, was in Abbildungsteil 3 der 
Abb. 5.1 mit einer Stichprobengröße von n = 30 dargestellt ist: Es ergibt sich im Ver- 
gleich zur Stichprobengröße n = 5 ein geringerer Standardfehler von 


oo 1 
a 0 


Der schmalere Verlauf lässt sich aber nicht nur durch den formalen Zusammenhang auf- 


O% 1.93: (5.3) 


srund des im Nenner stehenden Wurzelterms der Stichprobengröße n, sondern auch in- 
tuitiv begründen: Je größer eine Stichprobe wird, umso mehr Beobachtungen aus der 
Grundgesamtheit werden bei der Berechnung des Stichprobenmittelwertes berücksichtigt. 
Extreme Werte — also in unserem Beispiel: extreme Altersabweichungen vom Durch- 
schnitt — werden innerhalb der Stichprobe häufiger durch entsprechende Abweichungen 
in die andere Richtung „kompensiert“. Bei kleinen Stichproben ist dieser „kompensatori- 
sche“ Effekt tendenziell geringer, sodass die Stichprobenmittelwerte stärker streuen. 
Bisher sind wir bei unseren obenstehenden Überlegungen vom Sonderfall einer nor- 
malverteilten Grundgesamtheit ausgegangen. Letztlich können wir von der Normalver- 
teilungsannahme aber nur dann wirklich ausgehen, wenn die Grundgesamtheit bekannt 
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Würfelexperiment 1 Würfelexperiment 2 
E(x)=3,5;6 =1,71 E(x)=3,5;0 =1,71 





Häufigkeit 
oO 
— 
oO 


1 2 3 - 5 6 1 2 3 - 5 6 


Augenzahl 7 Augenzahl 


Stichprobenmittelwertverteilung (n=2) 


x=3,5;0.=1,21 


X 





Häufigkeit 
oO N Ro 


1 15 2 25 3. 35 2 45 5 55 6& 
Durchschnittliche Augenzahl bei n=2 Würfen 


Abb. 5.3 Verteilung des Mittelwertes bein = 2 Würfen mit einem fairen Würfel 


wäre, was ın der Regel aber nicht der Fall ıst. Dies führt uns zwangsläufig zu der Fra- 
ge über den Zusammenhang zwischen einer nicht-normalverteilten Grundgesamtheit und 
der dazugehörigen Verteilung der Stichprobenmittelwerte. Betrachten wir deshalb hierzu 
das Beispiel eines Würfelexperiments mit einem fairen Würfel, dessen Augenzahl mit 
einer gleichverteilten — also nicht normalverteilten — Wahrscheinlichkeit von 1/6 ein- 
trıtt. Der Mittelwert eines einzelnen Würfelexperiments entspricht demnach dem Wert 
u=(1+2+3+4+5+ 6)/6 = 3,5 mit einer Standardabweichung von o = 1,71. 
Der Würfel soll jeweils zweimal geworfen und der Mittelwert dieser Stichprobe (n = 2) 
gebildet werden. Betrachtet man alle theoretisch möglichen Ergebnisse“, so ergibt sich die 
Verteilung in Abb. 5.3. Obwohl die geworfene Augenzahl mit einem Würfel gleichverteilt 
ist, beginnt die Verteilung des Mittelwertes mit n = 2 Würfen bereits einer Normalver- 
teilung zu ähneln, wenngleich hier zunächst eher noch eine diskrete Dreiecksverteilung 
vorliegt. 

In Abb. 5.4 ist das gleiche Experiment mit jeweils vier Würfen durchgeführt worden. 
Tatsächlich ist die durchschnittliche Augenanzahl nun mit x = 3,5 und 05 = 0,85 einer 
Normalverteilung sehr ähnlich. Auch hier entspricht der Mittelwert der Stichprobenvertei- 
lung x = 3,5 dem Mittelwert der theoretischen Grundgesamtheit und der Standardfehler 


* Die theoretisch möglichen Ergebnisse für den Mittelwert der Stichproben sind: (1:1) — |]; 
(1;2) — 1,5; (153) > 2; (154) > 25; (155) > 3; (156) > 3,5; 2;1) > 1,5; 2;2) > 2; 
(2;3) > 2,5; (254) > 3; (255) > 3,5; (256) > 4; (351) > 2; (352) — 2,5; (353) > 3; 
(3;4) — 3,5; (3:5) > 4 (356) > 4,5; (41) > 2,55; (42) — 3; (453) > 3,5; (4,4) > 4; 
(4,5) — 4,5; (4,6) > 5; (5;1) > 3; (5;2) > 35; (553) > & (554) > 4,5; (555) —> 5; 
(5;6) > 5,5; (6; 1) > 3,5; (652) — 4; (6,3) > 4,5; (654) > 5; (655) > 5,5; (6,6) — 6. 
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o 1:71 
Gr = x 0,85. (5.4) 


"on Ya 


Dass dies kein Zufall ist, besagt das Zentrale Grenzwerttheorem (engl.: central limit theo- 
rem): Gemäß dieses Theorems geht eine Verteilung von Mittelwerten aus Stichproben des 
Umfangs n,die aus derselben Grundgesamtheit mit einer beliebigen Verteilung gezogen 
werden, mit wachsendem Stichprobenumfang in eine Normalverteilung über. Betrachten 
wir zur Anschauung die in Abb. 5.5 dargestellten Verteilungen der Stichprobenmittelwer- 
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te zweier nicht-normalverteilter Grundgesamtheiten: Auf der linken Seite der Abbildung 
sind aus einer bimodalen Grundgesamtheit (siehe Verteilung oben links) zunächst 30.000 
Stichproben der Größe n = 2 gezogen worden. Es ist zu erkennen, dass die Mittelwerte 
dieser Stichproben noch nicht normalverteilt sind (siehe Verteilung in der Mitte links). 
Bereits bei einer Stichprobengröße von n = 5 (sıehe Verteilung unten links) nähert sich 
die Stichprobenmittelwertverteilung aber der einer Normalverteilung. Ähnlich verhält es 
sich bei einer linksschiefen Grundgesamtheit auf der rechten Seite der Abbildung. 

Zusammenfassend kann also gesagt werden, dass beı einer hinreichend großen Stich- 
probe die Stichprobenmittelwerte normalverteilt sind, auch wenn die ursprünglichen Wer- 
te in der Grundgesamtheit einer beliebigen anderen Verteilung folgen. Somit müssen wir 
die tatsächliche Verteilung der Werte in der Grundgesamtheit gar nicht kennen und können 
dennoch von einer Normalverteilung der Stichprobenmittelwerte der Form 


N (# —) (5.5) 


ausgehen. Was als hinreichend große Stichprobe gelten kann, darüber sind sich die Theo- 
retiker und Praktiker nicht ganz einig: In den meisten Lehrbüchern wird aber von einer 
Stichprobengröße von n > 30 ausgegangen. 

Ebenfalls machen die Beispiele deutlich, dass auch für nicht-normalverteilte Zufalls- 
variablen und hinreichend großer Stichprobe mit Hilfe des Stichprobenmittels x auf das 
Mittel der Grundgesamtheit u geschlossen werden kann und der Standardfehler der Stich- 


probe tendenziell den Wert 
o 


Or Hr (5.6) 
annımmt. Um den Standardfehler zu bestimmen, müssten wir nun eigentlich die Stan- 
dardabweichung der Grundgesamtheit o kennen, was 1.d.R. nicht der Fall sein dürfte. 
Allerdings kann gezeigt werden, dass die Standardabweichung der Grundgesamtheit sehr 
gut durch die theoretische Standardabweichung der Einzelwerte einer Stichprobe Stheor — 
nicht zu verwechseln mit der Standardabweichung der Mittelwerte (!) — geschätzt werden 
kann.” Dies machte es uns möglich, den Standardfehler auch ohne Kenntnis der Standard- 


abweichung der Grundgesamtheit zu schätzen, denn es gilt dann: * 


A _ Stheor Semp (5.7) 


ö x n—|1 





° Studierende haben häufig Schwierigkeiten dabei, die Standardabweichung der Stichprobe Sineor 
und den Standardfehler oz zu unterscheiden. Der Standardfehler oz ermittelt die Streuung der 
Mittelwerte von vielen hintereinander gezogenen Stichproben, während Standardabweichung der 
Stichprobe Sctheor die Streuung der Einzelwerte einer Stichprobe beschreibt. 

* In der Statistik werden Schätzparameter durch ein „Dachzeichen‘“ gekennzeichnet. 
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Die beiden Stichprobenparameter x und Stheor erfüllen dabei als Schätzwerte für die Para- 
meter der Grundgesamtheit u und o folgende Eigenschaften: 


e Die Schätzer sind konsistent (engl.: consistent estimator), da sich die Schätzwerte mit 
zunehmendem Stichprobenumfang dem Wert des zu schätzenden Parameters immer 
mehr nähern. 

e Die Schätzer sind erwartungstreu (engl.: unbiased estimator), da der Erwartungswert 
der Stichprobenverteilung dem Parameter der Grundgesamtheit entspricht. 


5.2 Intervallschätzung 
5.2.1 Das Konfidenzintervall für den Erwartungswert 


Im vorhergehenden Abschnitt haben wir erstens gelernt, dass wir mit Hilfe des Stichpro- 
benmittelwertes x eine Punktschätzung für das Mittel der Grundgesamtheit u durchführen 
können. Wir haben aber zweitens auch gelernt, dass sich diese Punktschätzungen von 
Stichprobe zu Stichprobe unterscheiden und somit selbst eine Zufallsvariable darstellen, 
deren Verteilung wir kennen müssen, um die Genauigkeit dieser Schätzung beurteilen 
zu können. Je größer die Standardabweichung der Verteilung der Stichprobenmittelwerte 
ist, umso ungenauer ist unsere Schätzung. Drittens haben wir gelernt, dass die Vertei- 
lung zunächst zwar nicht bekannt ist, allerdings unter bestimmten Umständen von einer 
normalverteilten Verteilung der Stichprobenmittelwerte ausgegangen werden kann, wenn 
entweder 


a. die Grundgesamtheit selbst normalverteilt ist oder 
b. die Stichprobe bei beliebiger Verteilung der Grundgesamtheit mit n > 30 hinreichend 
groß ist. 


Wenn wir nun von einer Normalverteilung der Stichprobenmittelwerte ausgehen, so lässt 
sich für den Mittelwert der Grundgesamtheit u ein sogenanntes Konfidenzintervall be- 
stimmen. Es geht dabei nicht mehr darum, einen exakten Wert zu schätzen, sondern eine 
Intervalluntergrenze und eine Intervallobergrenze derart zu bestimmen, sodass das Inter- 
vall den wahren Wert mit einer gegebenen Sicherheit von (1 — «&) der Fälle überdeckt. 
Diese Sicherheit nennt man auch Konfidenzniveau (engl.: confidence level). Dabei stellt 
die Intervallschätzung nichts anderes als eine um einen „Fehlerspielraum“ ergänzte Punkt- 
schätzung dar. Beim oben bereits beschriebenen Preisbeispiel — „Mit 99-prozentiger Si- 
cherheit liegt der Durchschnittspreis eines Konkurrenzproduktes zwischen 2,36 und 2,40 
Euro“ - stellen die Grenzen 2,36 Euro und 2,40 Euro die untere Intervallgrenze (engl.: 
lower confidence limit) und die obere Intervallgrenze (engl.: upper confidence limit) dar. 
Das Konfidenzniveau (1 — «) beträgt 99%. 
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N(0;1) 






1-0=99% 






a/2=0,5% a/2=0,5% 





Lop=Lo,5% u=0 Fo Ze 
99 % Konfidenzintervall — 


| z-Iransformation | 


2,30% 2,40 € 





Abb. 5.6 Konfidenzintervall Preisbeispiel 


Die Größe eines Konfidenzintervalls hängt u. a. von der vom Forscher festgelegten Si- 
cherheit ab. Je sicherer der Forscher bei seinen Schätzungen sein möchte, umso größer 
muss er das Sicherheitsniveau (1 — «) wählen. Mit steigender Sicherheit nimmt also die 
Länge des Konfidenzintervalls zwangsläufig zu. 

Wie lässt sich nun ein derartiges Konfidenzintervall berechnen? Nun, wir wissen aus 
den Ausführungen zur Punktschätzung, dass die Stichprobenmittelwerte bei n > 30 nor- 
malverteilt sind. Es gilt also: 

x» N(u;oz). (5.8) 


Unterzieht man die normalverteilte Stichprobenverteilung einer z-Transformation und 
überführt die normalverteilten Werte somit in eine Standardnormalverteilung, ergibt sich: 


x u 


x 





ZZ 


 N(0: 1). (5.9) 


Diesen Schritt vollziehen wir deshalb, weil nur für die Standardnormalverteilung N (0; 1) 
tabellierte Werte vorliegen. Wir suchen somit nicht länger die Intervallober- und Intervall- 
untergrenze für x, sondern die für die jeweiligen z-transformierten Werte. Die Grenzen 
werden mit einer Sicherheit von (1 — «&) bestimmt. D.h., die Fehlerwahrscheinlichkeit 
darf den Maximalwert & nicht überschreiten. Bei einem zweiseitigen Intervall geht man 
davon aus, dass sich die maximale Fehlerwahrscheinlichkeit auf beiden Seiten des Inter- 
valls gleichmäßig verteilt — also zu &/2 über der Intervallobergrenze und zu &/?2 unter der 
Intervalluntergrenze liegt. 

Für unser oben genanntes Preisbeispiel ist dieser Zusammenhang in Abb. 5.6 schema- 
tisch dargestellt: Mit dem Konfidenzniveau von (1 — @) = 99% beträgt die maximale 
Fehlerwahrscheinlichkeit x = 1%. Da die Intervallgrenzen vor der z-Transformation den 
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Werten 2,36 und 2,40 Euro entsprechen, liegt auf Basis dieser Stichprobe der durchschnitt- 
liche Preis der Grundgesamtheit mit einer Wahrscheinlichkeit von @/2 = 0,5% unter 
2,36 Euro (linke grau markierte Fläche) und mit einer Wahrscheinlichkeit von ebenfalls 
a/2 = 0,5 % über 2,40 Euro (rechte grau markierte Fläche). Übertragen auf den z-Wert 
bedeutet dies, dass es sich bei diesen Fehlern um die Fälle handelt, bei denen die z-Werte 
kleiner als das z,,2-Perzentil oder größer als das z(1-u/2)-Perzentil der Standardnormalver- 
teilung sind. Alle z-Werte, die zwischen dem 20, 5%-Perzentil und dem z(99,5%)-Perzentil 
liegen, erfüllen also die Bedingung des Konfidenzniveaus von (1 — a) = 99%. 
Fasst man das Gesagte wieder in einer Formel zusammen, ergibt sich: 
Xu 





P (23 <z< 21-3) -1-asP (2 < < 2-4) je (5.10) 


Da Za/2 7 (-21-0/2) ist, gilt: 


 P(-zı9-<8-u<zıy:0r) -=1-o 


» P(-$-294 7<-u<—&+214:0r)=1-a. (5.11) 


Hieraus ergibt sich durch Multiplikation mit Minus Eins die Formel für die Berechnung 
eines Konfidenzintervalls: 


P(#-z19-H<u<X+tzıg-or)=1-a. (5.12) 


Der Erwartungswert der Grundgesamtheit u wird also mit einem Konfidenzniveau von 
(1—a) von einem Intervall überdeckt, dessen Intervallgrenzen sıch aus dem Mittelwert der 
Stichprobe abzüglich und zuzüglich des mit z(1-u/2, gewichteten Standardfehlers bestim- 
men. Die Größe des Standardfehlers oz ergibt sich in den seltensten Fällen direkt aus der 
Streuung der Grundgesamtheit o, da letztere in der Regel unbekannt ist. Die Schätzung 
des Standardfehlers erfolgt, wie bei der Punktschätzung, mit Hilfe der Standardabwei- 
chung der Stichprobe: 


a (5.13) 


In Abb. 5.7 wird die Berechnung von Konfidenzintervallen unter verschiedenen Bedin- 
gungen als Flussdiagramm zusammenfassend dargestellt. Dabei wird nochmals genau 
unterschieden, ob die Standardabweichung der Grundgesamtheit von vornherein bekannt 
ist (vgl. linken Ast in Abb. 5.7) oder nicht (vgl. rechten Ast in Abb. 5.7) und ob es sich 
um Stichproben mit oder ohne Zurücklegen handelt (vgl. Abschn. 3.3). Anhand dieser 
Darstellung wollen wir mit Hilfe von zwei Beispielen die Größe von Konfidenzintervallen 
bestimmen. 
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Grundvoraussetzung: Die Werte der Grundgesamtheit sind normalverteilt oder die Stichprobe ist größer/gleich 30 (n230). 





Ansonsten ist die Berechnung aufgrund mangelnder Güte der Normalverteilungsapproximation nicht sinnvoll. 
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Lesehilfe: 

Zweiseitige Intervalle: Bei zweiseitigen Intervallen bilden u,, die Unter- und Obergrenzen des 
Konfidenzintervalls. Mit einer Irrtumswahrscheinlichkeit von a liegt der „wahre“ Mittelwert der 
Grundgesamtheit innerhalb dieses Intervalls. Einseitige Intervalle: Ist danach gefragt, welchen Wert der 
Mittelwert der Grundgesamtheit mit einer Irrtumswahrscheinlichkeit von 0, (also mit einer Sicherheit von 
1-o) mindestens annimmt (größer-gleich Bedingung), bildet sich das Konfidenzintervall gemäß der zu 
berechnenden Untergrenze u, und der Obergrenze Unendlich. Ist danach gefragt, welchen Wert der 
Mittelwert der Grundgesamtheit mit einer Irrtumswahrscheinlichkeit von 0, (also mit einer Sicherheit von 
1-a) höchstens annimmt (kleiner-gleich Bedingung), bildet sich das Konfidenzintervall gemäß der 
Untergrenze minus Unendlich und der zu berechnenden Obergrenze u.. 


Abb. 5.7 Berechnung von Konfidenzintervallen für den Mittelwert 


Beispiel 1 

Angenommen, aus einer Grundgesamtheit mit N = 1000 Produkten sei die Standard- 
abweichung o = 0,6 fehlerhafter Produkte bekannt. Zudem ziehen Sie eine Stichprobe 
von n = 100 Produkten und erhalten einen Mittelwert von sechs fehlerhaften Produkten. 
In welchem Konfidenzintervall liegt der Mittelwert der Grundgesamtheit mit 90 %-ıiger 
Sicherheit, wenn 


a. die Stichprobe mit Zurücklegen gezogen wurde? 
b. die Stichprobe ohne Zurücklegen gezogen wurde? 
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Dieses Beispiel beschreibt somit den in der Praxis eher selten auftretenden Fall einer 
bekannten Streuung der Grundgesamtheit (vgl. linken Ast in Abb. 5.7). Für den Auf- 
gabenteil a. liegen folgende Informationen vor: Es handelt sich um eine Stichprobe mit 
Zurücklegen, der Standardfehler beträgt 


0. 0,6 
in »/100 


der Mittelwert der Stichprobe beträgt x = 6 und die Irrtumswahrscheinlichkeit ist « = 





= — 0,06. (5.14) 


10%. Für das gesuchte Konfidenzintervall ergibt sich entsprechend: 


Ku/o = X#2Z1-205 = 6=2,_(01) 0,1 = 6+1,65-0,06 > P(5,%01 < u < 6,099) = 0,9. 
(5.15) 
Die Unter- und Obergrenze des Konfidenzintervalls liegen bei 5,901 bzw. 6,099. 

Die Berechnung des Aufgabenteils b. erfolgt in ganz ähnlicher Form. Allerdings erfolgt 
die Ziehung der Stichprobe nun ohne Zurücklegen. Gleichzeitig handelt es sich um eine 
sogenannte finite — also eine endliche - Grundgesamtheit (engl.: finite population), deren 
Größe sich mit jedem weiteren Ziehungselement vermindert. In allen Fällen, in denen die 
Populationsgröße N bekannt und der Quotientn/N > 0,05 ist, wird deshalb die Streuung 
um den Faktor 

N-n 
N-]1 
reduziert (vgl. Abb. 5.7). Die Folge ist die Verkleinerung des Konfidenzintervalls, denn 





(5.16) 


je größer die Stichprobe im Verhältnis zur Grundgesamtheit ist, umso genauer ıst die 
Schätzung. Entsprechend ergibt sich folgende Berechnung: (1) Es handelt sich um eine 
Stichprobe ohne Zurücklegen; (2) n/N = 100/1000 = 0,1 > 0,05 und (3) 


. o Non 0,6 1000 — 100 


zen an, 20er 
= maNVNn-ı 70 Y 100-1 x = . 


(5:17) 
Für das gesuchte Konfidenzintervall ergibt sich entsprechend 
Auf =X + 2.20, =6+ 21_(&1) - 0,057 = 6 #& 1,65 - 0,057 
—> P(5,%6 < u < 6,094) = 0,9 (5.18) 


Die Unter- und Obergrenze des Konfidenzintervalls sind nunmehr 5,906 bzw. 6,094. 


Beispiel 2 

Aus einer großen Lieferung abgepackter Zwiebeln werden 10 Zwiebelnetze entnommen 
und folgende Gewichte ın kg ermittelt: 9,5; 10,5; 10,0; 10,0; 10,2; 10,0; 10,4; 9,6; 9,8; 
10,0. Das Gewicht der Zwiebelnetze sei näherungsweise normalverteilt. 
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a. Bestimmen Sie ein 95 %-Konfidenzintervall für das durchschnittliche Gewicht der ge- 
lieferten Zwiebelnetze! 

b. Wie schwer sind die gelieferten Zwiebelnetze im Durchschnitt mindestens? Bestim- 
men Sie hierzu das entsprechende einseitige 95 %-Konfidenzintervall! 

c. Wie schwer sind die gelieferten Zwiebelnetze im Durchschnitt höchstens? Bestimmen 
Sie hierzu das entsprechende einseitige 95 %-Konfidenzintervall! 

d. Wie würde das Ergebnis aus a. ceteris paribus lauten, wenn es sich bei der Stichpro- 
bengröße um 41 Zwiebelnetze gehandelt hätte? 


In diesem Fall ıst die Streuung der Grundgesamtheit nicht bekannt (vgl. rechten Ast in- 
Abb. 5.7). Es liegen folgende Informationen vor: (1) Die Größe der Grundgesamtheit N 
wird als infinit angenommen, sodass n/N < 0,05 gilt. (2) Der Stichprobenumfang ist mit 
n—1l = 10-1 = 9kleiner als 30, sodass das Konfidenzintervall mit Hilfe der 7-Verteilung 


berechnet wird. (3) Es lassen sich folgende Größen ermitteln: x = 10; Semp = 0,3; 
a = 5% und (4) 

A Semp 0. 

0x = ——— = ——— =N)l. (5.19) 


n—| v10-1 


Für das zweiseitige Konfidenzintervall aus Aufgabenteil a. ergibt sich entsprechend: 


Kup =Xttig s=1l0+t 


us 0110229901 
— P(9,774 < u < 10,226) = 0,9. (5.20) 
Für das einseitige Konfidenzintervall aus Aufgabenteil b. ergibt sich entsprechend: 
Au = X-1 67 = 10-11°505:0.1 = 10-1,812-0,1 P(9,819 < u) = 0,95. (5.21) 


Für das einseitige Konfidenzintervall aus Aufgabenteil c. ergibt sich entsprechend: 


HWo=xXH+tta ör= 104110005 :0,1= 10+1,812-0,1> P(p < 10,181) = 0,9. 

022) 
Für den Aufgabenteil d. könnte man nun aufgrund vonn — 1 = 41-1 = 40 > 30 von 
der Verwendung der t-Verteilung zugunsten der Normalverteilung absehen. Es ergibt sich 


_ ı Semp . 0,3 
en Zn 


= FO: NWITZEEIO IB) SUN. (9:29) 





Dass die Approximation der t-Verteilung durch die Normalverteilung vertretbar ist, zeigt 
das Ergebnis, welches im Vergleich zu einer Berechnung mit Hilfe der 7-Verteilung be- 
rechnet worden wäre: In diesem Fall liegt der Tabellenwert der t-Verteilung mit 40 Frei- 
heitsgraden bei 2,021. Das entsprechende Konfidenzintervall wäre lediglich um 6 Gramm 
länger und würde lauten: 


P (9,904 < u < 10,096) = 0,95. (5.24) 
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5.2.2 Planung der Stichprobengröße für Mittelwertschätzungen 


Der empirisch arbeitende Praktiker und Wissenschaftler hat neben der Frage nach dem 
statistischen Auswahlverfahren (vgl. Abb. 2.1) vor allem die Größe der Stichprobe festzu- 
legen. Hierbei ist die Bruttostichprobe von der Nettostichprobe zu unterscheiden: Erstere 
umfasst alle kontaktierten Personen einer zuvor definierten Zielgruppe. Aufgrund von ‚„Irr- 
läufern“ und falschen Ausgangsdaten kann sich im Nachhinein herausstellen, dass eine 
kontaktierte Person nicht zur Zielgruppe gehört. Bei der Bestimmung der Nettostichprobe 
werden sowohl diese als auch die nicht zurückerhaltenen Fragebögen herausgerechnet. Es 
wird somit um die „falsch Adressierten“ (engl.: incidence rate) und die Rücklaufquote 
(engl.: response rate) korrigiert. Für die Berechnung statistischer Ergebnisse ist letztlich 
die Größe der Nettostichprobe relevant, denn nur die zur Verfügung stehenden Datensätze 
können letztlich auch statistisch ausgewertet werden. Wir beschränken uns ım Folgenden 
deshalb auf die Bestimmung der sinnvollen Größe von Nettostichproben. 

Aus unseren bisher gewonnen Erkenntnissen wissen wir, dass die Genauigkeit einer 
Schätzung mit zunehmender Stichprobengröße zunimmt. Auf der einen Seite müssten wir 
also bestrebt sein, die Stichprobe möglichst groß zu wählen. Auf der anderen Seite steigen 
mit jeder zusätzlichen Beobachtung auch die Kosten und die aufzuwendende Zeit der 
Datenerhebung. Wie lässt sich vor dem Hintergrund dieser divergierenden Interessen eine 
angemessene Stichprobengröße bestimmen? Schlägt man einschlägige Lehrbücher auf, so 
finden sich hierzu viele unterschiedliche Vorschläge: 

So betonen Fowler (2002) und Oppenheim (1992), dass wichtige Subgruppen in einer 
Befragung - also z.B. Männer oder Frauen — zumindest jeweils 100 und unwichtigere 
Subgruppen zwischen 20 und 50 Beobachtungen aufweisen sollten. Lewin (2005) schlägt 
mindestens 30 zu Befragende pro Gruppe vor. Dabei sollte in der praktischen Anwen- 
dung immer bedacht werden, dass es sich bei diesen Werten um die Beobachtungsanzahl 
der Nettostichprobe handelt. Natürlich sind solche pauschalen Angaben von empirisch 
erfahrenen Wissenschaftlern hilfreich. Dennoch ist es bei der Bestimmung der angemes- 
senen Stichprobe immer auch nützlich, Aspekte wıe die Besonderheit der zu untersu- 
chenden Population, die Anzahl der zu erhebenden Variablen, die geplanten Methoden 
der Auswertung, die Stichprobengröße ähnlicher Studien in der Vergangenheit, etc. zu 
berücksichtigen. Letztlich hängt die anzustrebende Größe der Stichprobe von mehreren 
Faktoren ab, sodass die Frage nach der richtigen Stichprobengröße nicht immer mit einer 
allgemeingültigen Zahl beantwortet werden kann. Was wir seit der Berechnung von Konfi- 
denzintervallen in jedem Fall wissen, ist die Tatsache, dass bei gegebener Schätzpräzision 
die Stichprobengröße zum einen von der Streuung der Grundgesamtheit abhängt. Grund- 
gesamtheiten können in ihren Ausprägungen sehr homogen sein. Die damit verbundene 
geringere Streuung erfordert geringere Stichprobenumfänge, während bei heterogenen 
Grundgesamtheiten die Stichprobe tendenziell größer ausfallen muss, um die gleiche Si- 
cherheit bei Schätzungen zu erreichen. Zum anderen ist der Stichprobenumfang auch von 


5.2 Intervallschätzung 119 


N(9;1) 






1-0=95% 





a/2=2,5% 0/2=2,5% 





Lon=L2,5% n=0 £1.019=£297,5% 
+ —95 % Konfidenzintervall—: 
—z-Iransformation 

ee Länge: E=100 ES 
Untergrenze Obergrenze 


2 





Abb. 5.8 Länge eines zweiseitigen Konfidenzintervalls für den Mittelwert 


der vom Forscher gewünschten Genauigkeit der Schätzung geprägt. Je genauer der For- 
scher bei gegebenem Konfidenzniveau schätzen möchte, umso größer muss die Stichprobe 
sein. Die Zusammenhänge der Konfidenzintervalle lassen sich nun nutzen, um eine aus 
Sicht des Forschers sinnvolle Stichprobengröße zu berechnen. Folgendes Beispiel soll dies 
veranschaulichen: 

Eine Marktforschungsagentur führt eine Befragung zum Durchschnittseinkommen von 
Familien durch. Ziel der Analyse ist es, für das Durchschnittseinkommen ein zweiseiti- 
ges Konfidenzintervall mit einem Konfidenzniveau von 95 % zu schätzen, dessen Länge 
höchstens 100 Euro beträgt (vgl. Abb. 5.8). In einer Vorstudie ergab sıch eine Standard- 
abweichung von S.mp = >00 Euro. 

Die Länge des Konfidenzintervalls entspricht der Abweichung vom Mittelwert zur obe- 
ren Intervallgrenze zuzüglich der gleichlangen Abweichung zur unteren Intervallgrenze. 
Die beiden Abweichungen entsprechen bei infiniten Stichproben mit n > 30 jeweils dem 
mit Z(1-0/2) gewichteten Standardfehler Or. Es ergibt sich somit für die Länge des Inter- 
valls (vgl. Abb. 5.8): 


S theor S emp 


= 2: zı_a ——— 
„In 2 1 


Dies nach n aufgelöst ergibt die allgemeine Formel für die zu planende Größe einer Net- 





E=2:2zı_e 6, = 2: zı-4 & E = 100 Euro. (325) 


tostichprobe: 


Ds ge az ae 
i-& theor 1-5 m 
m er (5.26) 
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Abb. 5.9 Länge eines einseitigen Konfidenzintervalls bis zur beschränkten Intervallgrenze 


Nach Einsetzen in diese Formel erhält man für das Beispiel eine anzustrebende Netto- 
stichprobengröße von 386 Beobachtungen: 


4: 1,96? - 500? 


1002 + 1 = 385,15 — 386. (5.27) 


Auch für einseitige Konfidenzintervalle ergeben sich praxisrelevante Fragestellungen hin- 
sichtlich der Planung der Stichprobengröße: Nehmen wir einmal an, ein Reifenherstel- 
ler weiß aus einer Vorstudie, dass seine Reifen eine durchschnittliche Laufleistung von 
41.000 km bei einer Standardabweichung von Stheor = 8000 km aufweisen. Der Herstel- 
ler möchte seinen Kunden nun mit 99 %-iger Sicherheit eine Laufleistung von mindestens 
40.000 km zusichern. Wie groß muss die Stichprobe gewählt werden, damit mit 99 %-iger 
Sicherheit davon ausgegangen werden kann, dass dıe Laufleistung tatsächlich mindestens 
40.000 km beträgt? Abb. 5.9 verdeutlicht die Fragestellung grafisch. 

Die Berechnung erfolgt durch Einsetzen der Intervalluntergrenze von u, = 40.000km, 
dem Mittelwert der Stichprobe x = 41.000km und der Standardabweichung der Stich- 
probe Stheor = 8000 km in die folgende Formel: 














N Zi Yn Hu=X 


Z1-a 


2 
& $ Tr u x S Tr S Tr 
Ku = K21_4°0r = v2, theo a MW EEE theo zu. (- theo (5.28) 


Nach Einsetzen der Zahlen ergibt sich, dass die Nettostichprobe in jedem Fall 348 Beob- 
achtungen enthalten sollte: 


2 
SO00 
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5.2.3 Das Konfidenzintervall für Anteilswerte 


In der empirischen Praxis geht es nicht selten um den Sonderfall, dass ein Konfidenz- 
intervall für einen Prozentwert zu bestimmen ist. So ist es an Wahlsonntagen für kleine 
Parteien ın den ersten Hochrechnungen wichtig, dass die Untergrenze eines aus der Stich- 
probe repräsentativer Wahlkreise ermittelten, einseitigen Konfidenzintervalls mit großer 
Sicherheit über der Fünfprozenthürde liegt. Nur dann kann die Partei mit relativer Sicher- 
heit davon ausgehen, im Parlament vertreten zu sein. 

Aber auch in der wirtschaftswissenschaftlichen Analyse sind durchschnittliche Pro- 
zentanteile häufig Untersuchungsgegenstand: Wie groß sind Marktanteile einzelner Pro- 
dukte oder Produktlinien in der Grundgesamtheit eines Marktsegments‘? Die Beantwor- 
tung dieser und vieler anderer Fragen basiert also auf Datensätzen, in denen die zu unter- 
suchende Variable dichotom ist. Bezogen auf das erste obige Beispiele nımmt die Variable 
ParteiX den Wert Eins an, wenn ein Wähler die Partei X gewählt hat. Ansonsten erhält die 
Variable den Wert gleich Null. Im zweiten Beispiel erhält die Variable ProduktX den Wert 
Eins, wenn sich ein Kunde für das definierte Produkt X entschieden hat, ansonsten erhält 
die Variable den Wert gleich Null. Werden für derartige Variablen nun Durchschnitte ge- 
bildet, so liegen diese definitionsgemäß nur im begrenzten Definitionsbereich zwischen 
Null (= 0%) und Eins (= 100 %). 

Betrachten wir folgendes Beispiel hierzu etwas genauer: Ein Unternehmen der Nah- 
rungsmittelindustrie stellt sich die Frage, wıe groß mit 95 %-iger Sicherheit der wahre 
Marktanteil eines Joghurts einer neuen Geschmackssorte ist. Hierzu wird eine Stichpro- 
be inn = 300 Märkten gezogen, ın denen sich durchschnittlich 7 = 30% der Kun- 
den für diesen Joghurt entschieden haben. Gesucht werden also die Intervalluntergrenze 
und die Intervallobergrenze, sodass bei einem Konfidenzniveau von (1 — «) der wahre 
durchschnittliche Marktanteil x in der Grundgesamtheit vom Konfidenzintervall über- 
deckt wird. 

Analog zum Konfidenzintervall für den Mittelwert müssen wir uns zunächst fragen, wie 
sich die durchschnittlichen Prozentsätze p verteilen würden, wenn man viele Stichproben 
hintereinander ziehen würde. Hierzu wollen wir uns zwei Erkenntnisse aus vorangegan- 
genen Kapiteln zunutze machen: 


e Aus Abschn. 4.1.1 wissen wir, dass Binomialverteilungen approximativ einer Normal- 
verteilung folgen, wenn die Bedingung n - p- (1 — p) > 9 erfüllt ist. 

e Außerdem haben wir in Abschn. 5.1 festgestellt, dass eine normalverteilte Grundge- 
samtheit immer eine normalverteilte Stichprobenverteilung der Mittelwerte ergibt. 


Das bedeutet, dass — unter der Bedingung n - p - (1 — p) > 9 - die durchschnittlichen 
Prozentsätze p der Stichproben mit N (r; m) = N(r;07) normalverteilt sind. 

Analog zu den Erkenntnissen aus Abschn. 5.2.1 entspricht der durchschnittliche Anteil 
'p dem (asymptotischen und erwartungstreuen) Schätzer für den durchschnittlichen Anteil 
sr in der Grundgesamtheit. Entsprechend gilt auch (1 — p) als Schätzer für (1 — x), sodass 
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Zweiseitiges Intervall: 


Einseitige Intervalle: 


Lesehilfe: 

Zweiseitige Intervalle: Bei zweiseitigen Intervallen bilden u, die Unter- und 
Obergrenzen des Konfidenzintervalls. Mit einer Irrtumswahrscheinlichkeit von & 
liegt der „wahre“ durchschnittliche Anteilswert der Grundgesamtheit innerhalb 
dieses Intervalls. Einseitige Intervalle: Ist danach gefragt, welchen Wert der 
durchschnittliche Anteilswert der Grundgesamtheit mit einer Irrtumswahr- 
scheinlichkeit von a (also mit einer Sicherheit von 1-«) mindestens annimmt 
(größer-gleich Bedingung), bildet sich das Konfidenzintervall gemäß der zu 
berechnenden Untergrenze u, und der Obergrenze Unendlich. Ist danach gefragt, 
welchen Wert der durchschnittliche Anteilswert der Grundgesamtheit mit einer 
Irrtumswahrscheinlichkeit von a (also mit einer Sicherheit von 1-0) höchstens 
annimmt (kleiner-gleich Bedingung), bildet sich das Konfidenzintervall gemäß der 
Untergrenze minus Unendlich und der zu berechnenden Obergrenze u, 


Abb. 5.10 Berechnung von Konfidenzintervallen für den Anteilswert 
sich die Standardabweichung einer Grundgesamtheit o durch die theoretische Standard- 


abweichung der Stichprobe Stheor = v p (1 - p) schätzen lässt. Letztere nutzen wir zur 
Bestimmung des Standardfehlers der Stichprobe: 


$ eor 5 
6, = mn _ a äder (5.30) 


_ 9» eor u l< 
4 u 7 = ae p) Ar r © wenn n/N > 0,05 ist. 5.31) 
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In Abb. 5.10 ist die Bestimmung von Konfidenzintervallen für den Anteilswert mit Hilfe 
eines Flussdiagramms dargestellt. Für das obige Beispiel des Joghurtherstellers ergibt sich 
hieraus folgende Berechnung des zweiseitigen Konfidenzintervalls: 


_ u Date 
Ku/o = P E 21-8 05 — 0,3 zm 1,96 : a0 (3:32) 


Der durchschnittliche Anteilswert in der Grundgesamtheit liegt mit 95 %-iger Sicherheit 
zwischen 24,81 und 35,19 %. 


5.2.4 Planung der Stichprobengröße für Anteilswerte 


In Abschn. 5.2.2 wurde bereits die Idee der statistischen Bestimmung einer angemesse- 
nen Stichprobengröße diskutiert und eine entsprechende Formel auf Basis von Mittel- 
wertschätzungen metrischer Variablen abgeleitet. Handelt es sich bei der zu schätzenden 
Variablen nun um einen Anteilswert, kann diese Formel angepasst gleichermaßen verwen- 
det werden. 
2°. 21_g N 2° .21_« pl 7) 

nz ai ee 033) 
E entspricht wiederum der angestrebten Länge des Konfidenzintervalls und es muss eben- 
falls mit angenommenen Werten für p aus Vorstudien gearbeitet werden. 

Angenommen, der Joghurthersteller aus vorherigem Abschnitt möchte bei 95 %-iger 
Sicherheit ein zweiseitiges Konfidenzintervall mit einer Abweichung von höchstens 
2,5 %-Punkten ın beide Richtungen erhalten. Aus einer Vorstudie kennt er den durch- 
schnittlichen Anteilswert für p = 30%. 

Gesucht wird also ein Konfidenzintervall der Länge E = 2 2,5 %-Punkte = 5 %- 
Punkte (vgl. Abb. 5.11). Die dafür nötige Stichprobengröße ergibt sich aus folgender 
Berechnung: 


2 2 
2 "27008 -0,3-(1— 0,3) 4-.1,96°-0,21 


-— — = 1290,76 > 1291. (5.34) 
0.032 0,0025 


n = 


5.2.5 Das Konfidenzintervall für die Varianz 


In der empirischen Forschung geht es in den meisten Fällen darum, Konfidenzintervalle 
für Mittel- oder Anteilswerte zu bestimmen. Eher selten steht die Ermittlung entsprechen- 
der Intervalle für die Varianz der Grundgesamtheit im Vordergrund. Aus diesem Grund 
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Abb. 5.11 Länge eines zweiseitigen Konfidenzintervalls für den Anteilswert 


soll das Thema an dieser Stelle nur kurz mit Hilfe der entsprechend anzuwendenden For- 
meln ausgeführt werden. 
Für eine näherungsweise normalverteilte Grundgesamtheit gilt für... 


l. ... das zweiseitige Konfidenzintervall der Varianz: 
2 2 
pP (“ u DS: zo = (n — oe — pP (: * Semp <o?< a | 
2 eo 2 i a 
X1-%n-1 Xen-ı X1-%n-1 Ken-ı 
= [= & 
(5.35) 
2. ... für die Untergrenze eines einseitigen Konfidenzintervalls der Varianz: 
= n:-S2, 
pP (er — 1) Sinaoe _ 2 emp — z2 = (5.36) 
X1-o:n-1 X1-o:n-1 
3. ... für die Obergrenze eines einseitigen Konfidenzintervalls der Varianz: 
nel) n- 52, 
> 0? MI Siheor _ 37 Semp =1-o. (5.37) 
Xa:n-ı Xa:n-ı 


In allen drei Fällen wird zur Berechnung lediglich die Stichprobengröße n,dıe empirische 
oder theoretische Varianz der gezogenen Stichprobe sowie die entsprechenden Werte aus 
der Chi-Quadrat-Tabelle (vgl. Abschn. 8.2) für eine gegebene Irrtumswahrscheinlichkeit 
und eine gegebene Anzahl von Freiheitsgraden ( ee benötigt. 

Die Anwendung dieser Formeln soll anhand eines Beispiels kurz erläutert werden: Aus 
einer normalverteilten Grundgesamtheit wird eine Stichprobe vom Umfang n = 20 gezo- 


gen. Man ermittelt eine theoretische Varianz von S%,. = 8. 
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a. Ermitteln Sie ein zweiseitiges Konfidenzintervall für die Varianz der Grundgesamtheit 
mit einem Konfidenzniveau von 95 %! 

b. Wie groß ıst die Varianz höchstens, wenn ein Konfidenzniveau von 95 % angenommen 
wird? 


Für den Aufgabenteil a. ist die Formel für das zweiseitige Intervall der Varıanz anzuwen- 








den: 
pP (“ — U - Se < o? < (n < ) \ in ie 
X1-%n-1 Xen-ı 
19:8, 19-8 
> PI— <0?<— = 0,95. (5.38) 
X0,975:19 X 0,025:19 


Schlägt man die Werte in der Chi-Quadrat-Tabelle nach, so ergibt sich: 





152 J E52 2 
<o <——)=095->P (4,63 -o= 17,07) = 0.95, (5.39) 
32.852 8,907 
Auf Basis der Stichprobe kann also gefolgert werden, dass die Varianz der Grundgesamt- 
heit mit 95 %-iger Sicherheit zwischen den Werten 4,63 und 17,07 liegt. 
Für den Aufgabenteil b. erfolgt die Berechnung folgendermaßen: 


-1):5: 19-8 
P 0? 5 ML) Dior =1-a=>P[o"<— 0 (5.40) 
Ka:n-I X0,05;19 





Daraus ergibt sich: 





„_ 132 s 
P(o<--)=0,95= P (o? < 15,02) = 0,95. (5.41) 


Mit 95 %-iger Sicherheit ist die Varianz nicht größer als 15,02. 


5.2.6 Berechnung von Konfidenzintervallen mit dem Computer 


5.2.6.1 Berechnung von Konfidenzintervallen mit Excel 
Für die Berechnung von Konfidenzintervallen stehen in Excel zwei vorprogrammıerte 
Funktionen zur Verfügung: KONFIDENZ.NORM (Alpha, Standabwn; Umfang) und KON- 
FIDENZ.T(Alpha,Standabwn,; Umfang) ermöglichen die Berechnung eines Konfidenzin- 
tervalls für den Erwartungswert unter Verwendung der Normal- bzw. der 1-Verteilung. 
Unter Angabe der Irrtumswahrscheinlichkeit &, der Standardabweichung der Stichprobe 
und des Stichprobenumfangs berechnet Excel die Länge des halben Konfidenzbandes ım 
Umfang von 

21-4 "Or. (5.42) 
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Ober- und Untergrenzen des Konfidenzintervalls erhält man, indem man bei der Un- 
tergrenze diesen Wert vom Mittelwert der Stichprobe abzieht bzw. bei der Obergrenze 
hinzuaddiert. 

Auf der Homepage des Verlags” ist durch den Autor dieses Buches zudem ein Template 
zur Berechnung von einseitigen und zweiseitigen Konfidenzintervallen hinterlegt. Dabei 
erfolgt die Berechnung - im Gegensatz zu den integrierten Routinen von SPSS und Sta- 
ta — bei kleineren Stichproben (< 30) automatisiert auf Basis der 7-Verteilung. Ebenfalls 
automatisiert erfolgt die Korrektur der Stichprobenvarianz, falls die Populationsgröße N 
bekannt und der Faktor n/N > 0,05 ist. Neben den Konfidenzintervallen für Mittelwerte, 
durchschnittliche Anteilswerte und die Varianz lassen sich ebenfalls angemessene Stich- 
probenumfänge für Mittelwert- und Anteilswertschätzungen bestimmen. 

Zunächst wollen wir uns ein Beispiel zur Bestimmung eines Konfidenzintervalls für 
den Mittelwert genauer ansehen. Hierzu ist im Template zunächst das Tabellenblatt ‚„Kon- 
fidenzintervall Mittelwert“ zu öffnen: In alle grau markierten Zellen können Werte ein- 
gegeben werden. Die Stichprobengröße, der Mittelwert der Stichprobe, die Irrttumswahr- 
scheinlichkeit & und die Streuung (entweder die Standardabweichung der Grundgesamt- 
heit oder die Standardabweichung der Stichprobe) müssen in jedem Fall angegeben wer- 
den. Alle anderen Angaben sind optional. 

Angewendet auf die Preisvariable in der Beispieldatei salatoel.xIs werden zunächst 
der Mittelwert (=MITTELWERT(A2:A157)) und die Standardabweichung der Stichprobe 
(=STABWA(A2:A157)) berechnet und in das Template mit der Irrtumswahrscheinlichkeit 
vona = 0,05 eingegeben (vgl. Abb. 5.12). Im unteren Teil des Templates werden die 
Ergebnisse der einseitigen und zweiseitigen Konfidenzintervalle automatisiert berechnet: 
Der Standardfehler beträgt 0,021 Euro. Auf Basıs der Stichprobe liegt der wahre Mittel- 
wert des Preises in der Grundgesamtheit mit 95 %-ıger Sicherheit zwischen 1,967 Euro 
und 2,050 Euro. Die Länge des zweiseitigen Konfidenzintervalls beträgt 0,083 Euro. Für 
die ım oberen Teil des Templates angegebene gewünschte Höchstlänge des zweiseitigen 
Intervalls von 0,2 Euro muss die Stichprobe ceteris paribus n > 27,713 Beobachtungen 
groß sein. 

Für eine gleichbleibende Irrtumswahrscheinlichkeit von « = 0,05 ergibt sich für die 
einseitigen Intervalle: 


l. Mit 95 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei mindes- 
tens 1,97 Euro. 

2. Mit 95 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei höchstens 
2,04 Euro. 


Soll bei einseitigen Intervallen die beschränkte Intervallgrenze den im oberen Teil des 
Templates angegebenen Abstand zwischen Mittelwert und Mindest-/Höchstgrenze von 
0,1 Euro nicht überschreiten, muss die Stichprobe ceteris paribus einen Mindestumfang 
vonn > 19,814 Beobachtungen haben. 


> Siehe springer.com/9783834907530. 
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In alle grau markierten Zellen können 





ı Berechnung von Konfidenzintervallen für Mittelwerte Werte eingegeben werden. Die 

2 Gegebene Informationen Stichprobengrößse, der Mittelwert der 

m ana. ae a = Stichprobe, die Irrtumswahrscheinlichkeit 
a Da Jap Grije 26 h 5 es 

Bug »üiteiwert der Süchgeobe a (0) und die Streuung müssen angegeben 

5 Imtumswahrscheinlichkeit alpha 0,0% a All d A b ind 

6 Ist die Starndardabweichung der Grundgesamtneit bekannt (ja=l eine)? ü ww N: a 

7 * Empirische Standardabweichung der Stichprebe 0.2637 optional. 

3 " Empirische Varianz der Stichprobe II FEEr 

5 Größe der Grurdgesamitheit (Ü=unbekannt) M D 

10 Gewünschte Large des zweiseitigen Konädenzsntervalla 02 


Gewünschter Abstand zwischen Wittelwert und Mindest Höckstgrenze beim 


11 einseitigen Konädenzntervral 


Fi 
















13 Berechnete Zwischengrößen 

13 nH 0 Korrekturterm nicht nötig 

14 |in-1je 15>>M) und Varianz der Grundgesamiheit ist unbekannt 

15 => Annahme der Wormalrerteilung 

16 Standardabweichung der Stchprobermittelwerte (Standardiehler); 2.021 
m neu 

18 Eiselig Ergebnisse der einseitigen und 

19 = 1.960 z= 1.645 zweiseitigen Konfidenzintervalle. 
20 |Untergrenze 1967 Mindestgräße 1974 unendlich 

#1 Übergrenze 2050 Hiöchstgröße Bi: 





kindestgröße fürn bei 
gewünschter kindest- 13314 
273 Höchstgrenre 


22 Länge EI 0.083 
Mindestgröße fürn bei 
23 gewünschter Länge Kl 


Länge des zweiseitigen 
Konfidenzintervalls. 


Soll bei einseitigen Intervallen die 
beschränkte Intervallgrenze den o0.g. 


Bei 0.g. gewünschten Länge des Abstand zwischen Mittelwert und 


Mindest-/Höchstgrenze nicht 
überschreiten, muss n>19 sein. 


zweiseitigen Konfidenzintervalls muss 
die Stichprobe ceteris paribus n>27 sein. 





Formeln der einzelnen Excel Zellen: 

Zelle B13: =WENN ($F$9=0;0;F3/F9); Zelle B14: =F3-1; Zelle C14: =WENN(F3-1>30;">30";"<=30"); Zelle F16: 

=WENN (B13<0.05;(F7/((F3-(1-F6))*0.5));(F7/((F3-(1-F6))*0.5))*(((F9-F3)/F9)”0.5)); Zelle B19: =WENN (($F$3- 
1)+(30*F6)>30;NORMINV (1-($F5)/2;0;1);TINV (F5;F3-1)); Zelle B20: =F4-B19*F16; Zelle B21: =F4+B19*F16; Zelle B22: 
=B21-B20; Zelle B23: =(2*NORMINV (1-($F5)/2;0;1)*F7/F10)"2+(1-F6); Zelle E19: =WENN (($F$3- 
1)+(30*F6)>30;NORMINV (1-($F5)/1;0;1); TINV (F5*2;F3-1)); Zelle E20: =F4-E19*F16; Zelle F21: =F4+E19*F16; Zelle: E22: 
=(NORMINV (1-($F5);0;1)*F7/F11)”2+(1-F6) 


Abb. 5.12 Berechnung einseitiger und zweiseitiger Konfidenzintervalle für Mittelwerte mit Excel 


Für die Bestimmung der Konfidenzintervalle von Anteilswerten muss im Template das 
Tabellenblatt „Konfidenzintervall Anteilswert“ geöffnet werden: Wiederum sind in die 
grau markierten Zellen Werte einzugeben. Für das Beispiel des Nahrungsmittelherstellers 
aus Abschn. 5.2.3 und Abschn. 5.2.4 sind die Ergebnisse in Abb. 5.13 dargestellt. 

Last but not least kann für die Bestimmung eines Konfidenzintervalls einer Vari- 
anz im Template das Tabellenblatt „Konfidenzintervall Varianz“ geöffnet werden: Es 
müssen lediglich die Stichprobengröße, die Irrttumswahrscheinlichkeit « sowie die theo- 
retische Standardabweichung der Stichprobe angegeben werden. Für das Beispiel aus 
Abschn. 5.2.5 sind die Ergebnisse in Abb. 5.14 dargestellt. 


5.2.6.2 Berechnung von Konfidenzintervallen mit SPSS 

In SPSS lassen sich einseitige oder zweiseitige Konfidenzintervalle menügesteuert nur 
für den Mittelwert berechnen. Hierzu wird durch die Befehlsfolge Analyze — Des- 
criptive Statistics — Explore das Explore-Fenster geöffnet. Die Variablen, für die ein 


° In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Deskriptive Statistiken 
— Explorative Datenanalyse... 
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A B c D E F 300 Märkte werden befragt. 


Berechnung von Konfidenzintervallen für Anteilswerte' 








1 ee I 
= Durchschnittlicher Marktanteil in allen 
2 Gegebene Informationen 
3 Stchprebengröße n 30 erhobenen Märkten beträgt 30%. 
4 |Schätzer für den durchschnittächen Anteil 0.3 naRR - 
Ei rrtemswahrscheinlichkeit alpha 0.0507 | Irrtumswahrscheinlichkeit (Q). 
6 Ist die Standardabweichung der Grundgesamtreit bekannt (ja=] nein? u Berechnet sich aus dem durchschnitt- 
7 "Theoretische Standardabweichung der Stichprobe uns : i ; * N 
94 Größe der Grundgesamtheit (b"unbekannt] M 0 Größe der Grundgesamtheit ist 
10 Gewünschte Länge des zweiseitigen Konädenainterval; 0.05 bekannt 
Gewünschter Abstand zwischen Mittelwert und kindest-Höchstgrenre beim 005 UNDERA " 
12 [einseitigen Kondderzintervall n Für die Frage nach dem angemessenen 
rechnete Zwischengrößen . . “= 
= — — de — = —— Stichprobenumfang: Die Länge des 
rt kornekturterm ug ; i i . 
any 2991-30 | Hund Vartans der Gnmnigesamheitsst unbekannt Konfidenzintervalls soll nicht größer als 
15 > Annahme der Normmnalvertellung 0,05 sein. 
16  Standardabweichung der Stichprobenantelswerte (Standardiehler); Aue 
17 Intervallberechnung 











18 
13 
20  Untergrenze 0248 
21 Übergrenze 0.353 
37 Länge kl 0.14 Mindestgröße für n bei 

Mindestgröße fürn bei gewünschter kindest- ee 
23 gewünschter Länge KI ri Hochstgrenze 
24 
25 "Bedingung: n-p- (1-pr>9 


Einseitig 
z= 1.645 

Mindestgröße 0256 unendlich 
Höchstgröße 


Ergebnisse der einseitigen und 
zweiseitigen Konfidenzintervalle. 
Länge des zweiseitigen 
Konfidenzintervalls 


Soll bei einseitigen Intervallen die 
beschränkte Intervallgrenze den 0.8. 
Abstand zwischen Mittelwert und 
Mindest-/Höchstgrenze nicht 
überschreiten, muss n>909,06 sein 






Bei 0.g. gewünschten Länge (0,05) des 


zweiseitigen Konfidenzintervalls muss die 
Stichprobe ceteris paribus n>1290,73 sein. 





Formeln der einzelnen Excel Zellen: 

Zelle B13: =WENN ($F$9=0;0;F3/F9); Zelle B14: =F3-1; Zelle C14: = WENN (F3-1>30;">30";"<=30"); Zelle F16: 
=WENN(B13<0.05;(F7/((F3-(0-F6))*0.5));(F7/((F3-(0-F6))*0.5))*(((F9-F3)/F9)”0.5)); Zelle B19: = WENN ($F$3- 
1)+(30*F6)>30;NORMINV (1-($F5)/1;0;1);TINV (F5*2;F3-1)); Zelle B20 =F4-B19*F16; Zelle B21: =F4+B19*F16; Zelle B22: 
=B21-B20; Zelle B23: =(2*NORMINV (1-($F5)/2;0;1)*F7/F10)*2+(0-F6); Zelle E19: = WENN ($F$3- 
1)+(30*F6)>30;NORMINV (1-($F5)/1;0;1);TINV (F5*2;F3-1)); Zelle E20: =F4-E19*F16; Zelle F21: =F4+E19*F16; Zelle: E22: 
=(NORMINV (1-($F5);0;1)*F7/F11)N2+(0-F6) 


Abb. 5.13 Berechnung einseitiger und zweiseitiger Konfidenzintervalle für Anteilswerte mit Excel 






Stichprobenumfang n=20. 












A B c D E 
ı Berechnung von Konfidenzintervallen für Varianzen Irrttumswahrscheinlichkeit («=0,05). 
? Gegebene Informationen 
3 |Stichprobengröße n u Standardabweichung der Stichprobe 
4 Imtumswahrscheinlichkeit alpha 0.050 Se = Js j 
5 Theoretische Standardabweichung der Stchprobe Shser 252407125 
7 Zweiseilig Einseitig 
8 Chi’-Wert für Untergrenzenberechmung 32.552 Ein ET 
9 Chi-Wert für Öbergrenzeriberechnung 5 In1Ir - Fe - - 
11 Obergrenze der Varlanz 17066| unendlich 15.0219726 für die Varianz. 
12 Untergrenze der Standardabweichung 2151 
13 ÜMbergrenze der Standardabweichung 4131 


Ergebnisse einseitiger Konfidenzintervalle 
für die Standardabweichung. 


» 1 f . . .,. . . 
ze z a Ergebnisse einseitiger Konfidenzintervalle 
-unendlc a .. . . 
für die Varianz. 


Ergebnisse zweiseitiger Konfidenzintervalle 
für die Standardabweichunsg. 





Formeln der einzelnen Excel Zellen: 

Zelle B8: =CHIINV ((E4/2);E3-1); Zelle B9: =-CHUNV (1-(E4/2);E3-1); Zelle B10: =(E3-1)*(E5”*2)/B8; Zelle B11: =(E3- 
1)*(E52)/B9; Zelle B12: =B10*0.5; Zelle B13: =B11*0.5; Zelle D8: =CHIINV ((E4);E3-1); Zelle D9: =CHUNV (1-(E4);E3-1); 
Zelle D10: =(E3-1)*(E5”2)/D8; Zelle E11: =(E3-1)*(E5”2)/D9; Zelle D12: =D10*0.5; Zelle E13: =E11*0.5 


Abb. 5.14 Berechnung einseitiger und zweiseitiger Konfidenzintervalle für die Varianz mit Excel 
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Dependent List 


F HZ: Handzettelwerbu... ° Preis Salatoel [preis] ebene 

 TZ. Werbung Tagesz... « „FOR — 

°P Absatz Salatoel (in Fi... —n FI Explore Ratisics 
Faclor List 


aaa Ylbesenpives 
> |  Confidence Interval for Mean: ss % 
| M-estimalöors 
Label Cases by. | Gutliers 
| Percentiles 
r Display 


OBon @lsiisnes] © Pits (Gontnue) | Canceı | |_Heip_) 
et 


asmusnmuzer 





Standardfehler der Stichprobe. 


Untergrenze für das zweiseitige 
95%- Konfidenzintervall oder 





Preis Salatoel Mean 





























"95% Confidence Interval Lower Bound 
for Mean Upper Bound 2,0502 















5% Trimmed Mean 2.0114 |} = : 5 
—— Untergrenze für das einseitige 
—— 97 5%- Konfidenzintervall. 





Wanance 


Std. Deviation s: 23 
nn Obergrenze für das zweiseitige 


Maximum I68 95%- Konfidenzintervall oder 
Range 1 Obergrenze für das einseitige 
Interquartile Range 97,5%- Konfidenzintervall. 

Skewness 
Kurlosis 








Abb. 5.15 Berechnung einseitiger und zweiseitiger Konfidenzintervalle mit SPSS 


Konfidenzintervall berechnet werden soll, sind danach zu markieren und durch Klicken 
auf den mittleren Pfeil in das Feld Dependent Lists: zu verschieben. Danach ist durch 
Auswählen der Schaltfläche Statistics ... das Fenster Explore:Statistics zu öffnen, das 
Feld Descriptives auszuwählen und unter Confidence Interval for Mean das gewünschte 
Konfidenzniveau (1 — &) anzugeben. Möchte man beispielsweise die Berechnung eines 
zweiseitigen 95 %-Konfidenzintervalls berechnen, muss hier der Wert 95 angegeben wer- 
den. Sollen hingegen die beiden einseitigen 95 %-Konfidenzintervalle berechnet werden, 
muss der Wert 90 angegeben werden. Der Grund hierfür ist folgender: Bei einem ein- 
seitigen Intervall entsteht die maximale Fehlerwahrscheinlichkeit nur auf einer Seite der 
Verteilung. Da SPSS aber ausschließlich zweiseitige Intervalle berechnet, muss — damit 
die vollen x = 5 % auf der beschränkten Seite eines einseitigen Intervalls zur Berechnung 
kommen - der Wert für « verdoppelt werden. Generell erfolgt bei einseitigen Konfidenz- 
intervallen mit einem Konfidenzniveau von (1 — &) immer die Eingabe des Wertes für 
(1—2-.). Mit Bestätigung durch Continue kann das Fenster wieder geschlossen werden. 
Durch OK erfolgt die gewünschte Berechnung. 

Aus der Datei Salatoel.sav wurde in Abb. 5.15 dıe Variable Preis beispielhaft zur 
Berechnung eines zweiseitigen 95 %-Konfidenzintervalls herangezogen: Auf Basis der 
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Stichprobe liegt der wahre Mittelwert des Preises in der Grundgesamtheit mit 95 %-iger 
Sicherheit zwischen 1,97 Euro und 2,05 Euro. Der Standardfehler beträgt 0,02 Euro. Aber 
auch die beiden einseitigen 97,5 %-Konfidenzintervalle können mit verändertem Konfi- 
denzniveau der Abb. 5.15 entnommen werden: 


l. Mit 97,5 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei min- 
destens 1,97 Euro. 

2. Mit 97,5 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei höchs- 
tens 2,05 Euro. 


5.2.6.3 Berechnung von Konfidenzintervallen mit Stata 

In Stata gibt es zwei Möglichkeiten, Konfidenzintervalle für Mittel- und Anteilswerte zu 
berechnen. Im einen Fall wird davon ausgegangen, dass die entscheidenden Parameter wie 
die Stichprobengröße, der Mittel- bzw. der Anteilswert sowie dıe Standardabweichung der 
Stichprobe bereits berechnet vorliegen. Durch die Befehlsfolge Statistics > Summaries, 
tables, and tests > Summary and descriptive statistics > Normal CI Calculator wird 
das Befehlsfenster zur Berechnung eines Konfidenzintervalls für einen Mittelwert (vgl. 
oberes Befehlsfenster in Abb. 5.16 für den Beispielfall aus der Datei salatoel.dta) geöff- 
net. Durch die Befehlsfolge Statistics > Summaries, tables, and tests — Summary and 
descriptive statistics > Binomial CI Calculator wird das Befehlsfenster zur Berechnung 
eines Konfidenzintervalls für einen Anteilswert aufgerufen (vgl. unteres Befehlsfenster ın 
Abb. 5.16 für das Beispiel des Nahrungsmittelherstellers aus Abschn. 5.2.3). Durch Be- 
stätigung durch OK erfolgt die gewünschte Berechnung. 

In den seltensten Fällen liegen die Parameter aber vorab ın berechneter Form vor, so- 
dass der zweite Fall der Konfidenzintervallberechnung direkt aus einem Rohdatensatz die 
übliche Berechnungsart sein dürfte. Auch hier wollen wir den Datensatz salatoel.dta als 
Beispiel verwenden: Durch die Befehlsfolge Statistics > Summaries, tables, and tests — 
Summary and descriptive statistics > Confidence intervals öffnet sıch das entsprechende 
Befehlsfenster. Unter Variables: (leave empty for all variables) sınd die Variablen anzu- 
geben, für die ein Konfidenzintervall berechnet werden soll (vgl.Abb. 5.17). Das ist in un- 
serem Fall zunächst die metrische Variable Preis. Im gleichen Fenster ist unter Confidence 
Level das gewünschte Konfidenzniveau (1 — «&) für einseitige 95 %-Konfidenzintervalle 
einzutragen. Sollen einseitige Intervalle berechnet werden, ist hier der Wert für (1—2-«) 
anzugeben (siehe Begründung im Abschn. 5.2.6.2). Mit Auswahl der Continue Schaltflä- 
che kann das Fenster wıeder geschlossen werden. Mit Bestätigung durch OK erfolgt die 
gewünschte Berechnung. 

Die Interpretation der Ergebnisse erfolgt wiederum analog zu den mit SPSS ermittelten 
Ergebnissen: 


l. Auf Basis der Stichprobe liegt bei zweiseitigen Konfidenzintervallen der wahre Mittel- 
wert des Preises in der Grundgesamtheit mit 95 %-iger Sicherheit zwischen 1,97 Euro 
und 2,05 Euro. Der Standardfehler beträgt 0,02 Euro. 
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22] ei - Normal confidence intervals and standar. oe |&| Konfidenzintervall für den Mittelwert: 
Parameter Stichprobengröße, der Mittelwert sowie 
die theoretische Standardabweichung der 

2.0085 Sample mean Stichprobe aus der Datei salatoel.dta liegen 


1: Sample sire 


berechnet vor. Unter Confidence level ist bei 


0.2654 Sarple sandand deviation me ” 
zweiseitigen Intervallen der Wert für (1-0) 


anzugeben, bei einseitigen Intervalle der Wert für 
(1-20). 


= ” Conhdence level 





@ 0 Bi [Cancel | Submd 





Variable | Obs Mean Std. Err. [95% Conf. Intervall] 
a a a m m a a +---------------------------------------------- ------------ -- --.- 
2.0085 .021249 1.966525 2.050475 


Mittelwert der Stichprobe. Mitelwert der Stichprobe. |] 

Standardfehler der Standardfehler der Stichprobe. —00 
Untergrenze en en — das zweiseitige 95%- Konfidenzintervall oder 
Untergrenze für das einseitige 97,5%- Konfidenzintervall. 






Obergrenze für das zweiseitige 95%- Konfidenzintervall oder 
Obergrenze für das einseitige 97,5%- Konfidenzintervall. 








_] eii- Binomial confidence intervals and standardemos [>] © Es] Konfidenzintervall für den Anteilswert: 
Parameter Stichprobengröße sowie die 
Anzahl der Erfolge liegen berechnet vor. 


A = Sample size 








BO-+- Successes Unter Confidence level ist bei 
2] Gaaidence el zweiseitigen Intervallen der Wert für (1-0) 
| anzugeben, bei einseitigen Intervalle der 
Bincmial confidenge intenwal : 
Wert für (1-2:0). 
8 Exact 
Wald 
Wilson 
Ares 
Jeilneys 
0% LK) [Come] [_Suomt| 
-- Binomial Exact -- 
Variable | Obs Mean Std. Err: [95% Conf. Intervall] 
Br Dee 


.0264575 .2486816 3338195 


300 “_ 
a für das zweiseitige 95%- Konfidenzintervall oder 
Untergrenze für das einseitige 97,5%- Konfidenzintervall. 






Obergrenze für das zweiseitige 95%- Konfidenzintervall oder 


Obergrenze für das einseitige 97,5%- Konfidenzintervall. 


Abb. 5.16 Konfidenzintervallberechnung mit dem CI Calculator von Stata 
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TITTEN WERTE mENE OBERE RE 
Main | byif/n | Weights | 
Wariables: jeawe empty for all variables) 


preis] 


Üpbons 
Varsble pe 


a Hormal variable: 
Binomial variable (0171) 
Foiszorı vanables 


Exposure variable (uses Poisson) Jeffreys 
Add output for all groups combined for use with by only) 


5 Separalor na every N variable: (set Üfor none] 


= w Condicenoe kewel 
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Angabe der Variablen, für die das 


Konfidenzintervall berechnet werden 
soll. 





Normal variables ist auszuwählen, 
wenn ein Konfidenzintervall für den 


Mittelwert einer metrischen Variablen 





Angabe des Konfidenzniveaus. 


[95% Conf. Intervall] 


ee +--------------------------------- ----------------------------.-. - 
0211168 


a0B EoK 
Variable | Obs Mean 
2.008518 


preis | 156 


Mittelwert der Stichprobe = 


Standardfehler der Stichprobe. 


Untergrenze für das zweiseitige 95%- Konfidenzintervall oder 


Untergrenze für das einseitige 97,5%- Konfidenzintervall. 


1.966803 


2.050232 


Obergrenze für das zweiseitige 95%- Konfidenzintervall oder 
Obergrenze für das einseitige 97,5%- Konfidenzintervall. 





Abb. 5.17 Berechnung einseitiger und zweiseitiger Konfidenzintervalle für den Mittelwert mit Stata 


2. Mit 97,5 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei einem 
— auf der linken Seite beschränkten - einseitigen Konfidenzintervall bei mindestens 


1,97 Euro. 


3. Mit 97,5 %-iger Sicherheit liegt der wahre Mittelwert der Grundgesamtheit bei einem 
— auf der rechten Seite beschränkten - einseitigen Konfidenzintervall bei höchstens 


2,05 Euro. 


Hätte es sich bei der zu untersuchenden Variablen nun nicht um die metrische Variable 
Preis, sondern um die binäre Variable rz („Wurde das Produkt in der Woche X in der 
Tageszeitung beworben?“ Ja = 1; Nein = 0) gehandelt, wäre die Vorgehensweise ähnlich 
gewesen: Im Befehlsfenster hätte lediglich die Option Binomial variables (0/1) gewählt 
werden müssen (vgl. Abb. 5.18). Mit 95 %-iger Sicherheit liegt der Anteil der Wochen mit 
Werbung für das Produkt in einer Tageszeitung zwischen 3,12 und 11,47 %. 
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ee 


_] ci - Confidence intervals for means, proportions, and counts 











Main |byulk/in. | Weights | Angabe der Variablen, für die das 


Konfidenzintervall berechnet werden 
soll. 


Variables: jeane empby for all variables)| 
iz 


Binomial variables ist auszuwählen, 





Oelions 
Variable type Binomial confidence intenral wenn ein Konfidenzintervall für den 
Hormal varisbies bad Anteilswert einer binomialen 
ö) Binomial variable (01) Wald Variablen bestimmt werden soll. 
Poisson vanables Yıllaorı 
Agresti-Coull 
E:xpösure varable (ses Polssanı) Jeffreys 


Add output for all groups anenlbined for use: wih by only) 
5-= Separator ine every N variables (se Ofor none) 


Angabe des Konfidenzniveaus. 


EE] * Confidence kewel 


a0: 


Variable | Obs Mean Std. Err. [95% Conf. Intervall] 
En a a u a +------------------------------ ------------------------------- -.- 
tz | 156 .0641026 .0196105 .0311649 .1147261 


Mittelwert der Stichprobe. r 
Standardfehler der Stichprobe. 


Untergrenze für das zweiseitige 95%- Konfidenzintervall oder 
Untergrenze für das einseitige 97,5%- Konfidenzintervall. 





Obergrenze für das zweiseitige 95%- Konfidenzintervall oder 
Obergrenze für das einseitige 97,5%- Konfidenzintervall. 





Abb. 5.18 Berechnung einseitiger und zweiseitiger Konfidenzintervalle für einen Anteilswert mit 
Stata 


5.3 Übungsaufgaben zur Parameterschätzung 


Aufgabe 31 

Ein schwierig zu justierendes Metallschneidegerät schneidet von einem durchlaufenden 
Metallband Stücke ab, die eine bestimmte Länge u haben sollen. Auch bei fest gewählter 
Einstellung kann es zu zufälligen Schwankungen in der Länge des Metallbandes kommen, 
wobei die Länge als normalverteilt anzunehmen ist. 


a. Sie ziehen eine Stichprobe von 17 Bändern und ermitteln einen durchschnittlichen 
Wert von 150cm bei einer empirischen Varianz von S? = 5,76cm?. Bestimmen Sie 
ein 80 %-Konfidenzintervall für die durchschnittliche Bandlänge. 
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b. Wie groß müsste die Stichprobe mindestens sein, damit ein zweiseitiges 90 %- 
Konfidenzintervall der Durchschnittslänge der Metallbänder höchstens eine Länge 
von 1,2 cm hat? 

c. Wie groß ist die anzunehmende Varianz mindestens, wenn ein Konfidenzniveau von 
90 % angenommen wird? 


Aufgabe 32 


a. Wıe kann man den Schätzfehler beim Schätzen eines Parameters einer Grundgesamt- 
heit mittels einer Stichprobe reduzieren’? 

b. Wie kann man die Genauigkeit einer Schätzung von u mittels einer Stichprobe verbes- 
sern’? 


Aufgabe 33 

Pro Tag besuchen mehr als 10.000 Kunden Ihr Geschäft. Eine aus einer normalverteil- 
ten Grundgesamtheit gezogene Stichprobe von n = 20 aus Ihrem Geschäft ergibt eine 
empirische Varianz für die Verweildauer der Kunden von S? = 10° Minuten‘. 


a. Bestimmen Sie das 99 %-Konfidenzintervall für die empirische Varianz! 

b. Ermitteln Sie für das gleiche Geschäft das zweiseitige 95 %-Konfidenzintervall für die 
mittlere Verweildauer der Kunden! Die Stichprobe mit dem Umfang n = 20 ergibt 
eine mittlere Verweildauer von 55 Minuten. 

c. Wie groß müsste die Stichprobe sein, damit das zweiseitige 95 %-Konfidenzintervall 
der durchschnittlichen Verweildauer höchstens eine Länge von 4 Minuten hat? 


Aufgabe 34 

Ihr Unternehmen „Leckermarkt‘‘ möchte seine Schokoladenmischung in neuer Verpa- 
ckung auf den Markt bringen. Die Unternehmensführung ist sich allerdings noch über 
die Farbe der Verpackung unsicher. Bisher wurden die Pralinen in Gelb verpackt. In der 
Diskussion steht aber nun ebenfalls eine blaue Verpackung. 


a. Im Rahmen einer Marktforschungsstudie in 25 der 200 deutschen Leckermärkte sollen 
Sıe die Wirkung der Verpackungsfarben auf den wöchentlichen (normalverteilten) Ab- 
satz der deutschen Märkte untersuchen. Für die Pralinen in blauer Verpackung wird ein 
durchschnittlicher Wochenabsatz von 9982 Packungen bei einer empirischen Standard- 
abweichung von 410 Packungen ermittelt. Bestimmen Sie ein 90 %-Konfidenzintervall 
für den erwarteten Absatz! 

b. Wie ändert sich das Konfidenzintervall, wenn Sie eine höhere Vertrauens- bzw. Sicher- 
heitswahrscheinlichkeit wählen? Begründen Sie Ihre Aussage! 

c. Wie groß ist die wahre empirische Standardabweichung mit einer Wahrscheinlichkeit 
von 99,5 % mindestens? 


5.4 Lösungen der Übungsaufgaben 135 


Aufgabe 35 

Ein Automobilhändler möchte wissen, wıe viel Prozent seiner 1500 Kunden, die vor fünf 
Jahren ein Kfz bei ihm erworben haben, mit 95 %-iger Sicherheit weiterhin dieses Fahr- 
zeug fahren. In einer Zufallsstichprobe von 250 Kunden fahren 207 Kunden heute ein 
anderes Fahrzeug. 


a. Bestimmen Sıe das entsprechende Konfidenzintervall! 

b. Wie sähe das Konfidenzintervall bei gleicher Schätzung für den Anteilswert aus, wenn 
die Grundgesamtheit 10.000 Kunden betragen hätte? 

c. Wie groß müsste die Stichprobe aus Aufgabenteil b) mindestens sein, damit die Länge 
des Konfidenzintervalls höchstens 6 Prozentpunkte beträgt? 

d. Wie viele Kunden sind es mit 95 %-iger Sicherheit höchstens? 

e. Wie viele Kunden sind es mit 95 %-iger Sicherheit mindestens, wenn von 60 Befragten 
noch 10 Kunden das Kfz des Händlers fahren würden? 


5.4 Lösungen der Übungsaufgaben 


Lösung 31 


a. Die Grenzen des Konfidenzintervalls bei unbekannter Varianz berechnen sich durch: 


a [A 
a = 1_a0r. 


Da der Korrekturterm nicht nötig ist und bei Annahme der t-Verteilung (dan < 30) gilt: 


en X+t).g Öör = X+t,'26r = 150+1,337-.0,6 — u, = 149,1978; u, = 150,8022. 
2 


b. Zur Bestimmung der Stichprobengröße kann die 7-Verteilung nicht herangezogen wer- 
den, da die 7-Werte selbst von der Stichprobengröße abhängen. Approximativ kann die 
Normalverteilung angenommen werden, wenn die errechnete Stichprobengröße den 
Wert 30 überschreitet. Für die Länge des Konfidenzintervalls mit unbekannter Varianz 
der Grundgesamtheit gilt somit: 





Sen 2,4 2 
e=2-z_205 =2-z_e — u =-2.1,65-—— =12=sVn-] 
m 2, m-1 sn] 
Dee 
. 1,2 


21,65: 2,4\° 


Da die Stichprobengröße weit über dem Wert 30 liest, ist die Verwendung der Normalver- 
teilung zulässig. 
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c. Das einseitige Konfidenzintervall (Untergrenze) berechnet sich durch: 


nS? 5 17:2.4° 5 
Pr eo -1-a=>P 5 <o’I=1-—-O,)]| 
Yu X1-0,1 


Le = 0,9 P (4,16 < 0?) = 0,9 
2352) ern 








Lösung 32 


a. Durch Erhöhung des Stichprobenumfanges (n vergrößern). 
b. Durch Erhöhung des Stichprobenumfanges (n vergrößern). 


Lösung 33 


a. Das zweiseitige Konfidenzintervall der Varianz berechnet sıch durch: 








I-&;n-1 Xen-ı 
20 - 10? 20 - 10? 
2 <o’<— =1-0,01 
X ]_001 99-1 X001 0-1 
2000 J 2000 J 
<o?< —— | = 0,99 P (51,837 < 0? < 292,228) = 0,99. 
38,582 6,844 


b. Die Grenzen des Konfidenzintervalls bei unbekannter Varianz berechnen sich durch: 
Kuyo = X HE en Oz. Da der Korrekturterm nicht nötig ist und bei Annahme der [- 
2 
Verteilung (dan < 30) gilt: 


u x+t_a 6x = X+t 50565 = 554+2,093-2,2942 — u, = 50,198; 1, = 59,802 
mr & 


c. Zur Bestimmung der Stichprobengröße kann die 7-Verteilung nicht herangezogen wer- 
den, da die 7-Werte selbst von der Stichprobengröße abhängen. Approximatiıv kann die 
Normalverteilung angenommen werden, wenn die errechnete Stichprobengröße den 
Wert 30 überschreitet. Für die Länge des Konfidenzintervalls mit unbekannter Varianz 
der Grundgesamtheit gilt somit: 


Sn 2 #196: 10, 
e= 2.2.4505 =2.2.5  — =4= vn-1 7) 
aA/N — 


2.1,96- 10\ 
Fe +1 = 97,042 98. 


Da die Stichprobengröße weit über dem Wert 30 liest, ıst die Verwendung der Normalver- 
teilung zulässig. 
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Lösung 34 


a. Die Grenzen des Konfidenzintervalls bei unbekannter Varianz der Grundgesamtheit 
und bei (n — 1) < 30 sowie n/N > 0,05 berechnen sich durch: 


N-n Semp N-n 


Jn-l N 


00921711 ı Re 
25-1 200 


— Hu = 9848,06; uo = 10.115,94 (durch Rundungen kann es zu leichten Abwei- 
chungen kommen). 








er I _gör- —-—xXH+ 1-2 


b. Intervall wird länger. Grund: T-Wert steigt und größere Sicherheit erfordert größeres 
„Aktionsfeld‘“. 

c. Die Untergrenze des einseitigen Konfidenzintervalls der empirischen Varianz berech- 
net sich durch: 


ns, 25.410? 
P ———— < 0’ - 1-0 —P —— <o’ —= 99,5% 
X1-a:n-1 


X 99,5 %:n—1 
— P (92.244,014 < 0°) = 99,5 %. 


Für die Standardabweichung ergibt sich entsprechend: P(Y92.244,014 < vo?) = 
P(303,717494 < o) = 99,5 %. 


Lösung 35 


Der Anteil der Kfz-Halter, die nach wie vor das Fahrzeug fahren, ist: p = 1— = = 0.172 


a. Dan/N = 0,167 > 0,05, ermittelt sich das Konfidenzintervall wie folgt: 


u  IN-n 0,172- (1 — 0,172) [1500 — 250 
Hufo = Ptzı_a ör zo rn 
2 N 250 1500 - 1 


Der durchschnittliche Anteilswert in der Grundgesamtheit liegt mit 95 %-iger Sicherheit 
zwischen 12,9 und 21,5 %. 





b. Das Konfidenzintervall ermittelt sich ohne Korrekturterm entsprechend wie folgt: 


_ „ 017-4012) 
Kup = P & 21-9 67 = 0,1724 1,96. | 


Der durchschnittliche Anteilswert in der Grundgesamtheit liegt mit 95 %-iger Sicherheit 
zwischen 12,5 und 21,9%. 
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c. Der Mindestumfang der Stichprobe müsste n = 608 sein: 


I, 'p-l=P) 22.1,98.0,172- (10,172) 


z Az = 607,9 — 608. 


n = 


d. Es sind höchsten 21,1 % der Kunden: 


0,17:-A41=012) 


Mo=P+ Zı-a 65 = 0,172 + 1,96: = 


= 21,1%: 

e. Da die Bedingung n - p- (1 — p) > 9 nicht erfüllt ist, Kann die Berechnung des 
Konfidenzintervalls auf Basıs der Approximation durch die Normalverteilung nicht 
erfolgen. 
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Testverfahren 


Zu den wichtigsten Techniken in der Statistik gehören die sogenannten Hypothesentests. 
Nimmt man den Begriff der Hypothese zunächst wörtlich (lat.: Unterstellung), dann geht 
es bei einer Hypothese um die Annahme über einen bestimmten Sachverhalt. Hypothesen 
sind Vermutungen, die in der empirischen Forschung nicht einer plötzlichen Eingebung 
oder einer „fixen Idee‘ entspringen, sondern sich aus theoretischen Vorüberlegungen ab- 
leiten sollten. Befindet man sich auf dem Weg der Wahrheitssuche, wird man versuchen, 
die Hypothesen kritisch zu prüfen und sie durch Zusammentragen empirischen Materials 
zu bestätigen (verifizieren) oder sie zu verwerfen (falsifizieren). 

Zunächst könnte man der Auffassung sein, dass das Verifizieren einer Hypothese doch 
der direkte Weg zum Erkenntnisgewinn sein müsste. Karl Popper (1934) konnte in sei- 
nem Buch zur Logik in der Forschung mit einem schönen Beispiel aber belegen, dass 
im Rahmen empirischer Forschung ein Erkenntnisgewinn nur über die Falsıfikation einer 
Hypothese erreicht werden kann: Er stellte sich die Frage, wie die Hypothese, es gäbe nur 
weiße Schwäne, empirisch belegbar sei. Beobachtet man in einer Feldforschung nun aus- 
schließlich weiße Schwäne, so ıst dies kein 100 %-iger Beleg für die Nichtexistenz eines 
schwarzen Schwanes. Die aufgestellte Hypothese wäre also nicht bewiesen. Beobachtet 
man hingegen einen schwarzen Schwan, so ist die Ausgangshypothese — alle Schwäne 
sind weiß — sofort und mit 100-iger Sicherheit widerlegt. Erst durch Falsifikation der Hy- 
pothese kann sich also ein Erkenntnisgewinn einstellen. 

Auch bei statistischen Hypothesentests besitzt die Falsıfikation der Ausgangshypothe- 
se eine besondere Bedeutung. Die hierzu von Neyman und Pearson (1928a, 1928b; 1937) 
entwickelte Technik des Hypothesentestens geht von der Existenz einer Nullhypothese 
Ho und einer Gegenhypothese 7, aus. Anhand einer Stichprobe wird - bei festgelegter 
maximaler Irrtumswahrscheinlichkeit & — die Nullhypothese A, statistisch getestet, um 
Auskunft über die Grundgesamtheit zu erlangen. Die festgelegte und maximale Irrtums- 
wahrscheinlichkeit & wird auch als Signifikanzniveau bezeichnet. 
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140 6 Testverfahren 
Bei der Technik des Hypothesentestens kann es zwei mögliche Ergebnisse geben: 


l. Die Nullhypothese A, wird falsifiziert. Wir finden also sinnbildlich einen schwarzen 
Schwan in unserer Stichprobe. Durch Falsıfıkation können wir also mit einer maxi- 
malen Fehlerwahrscheinlichkeit von « davon ausgehen, dass A} gilt. I.d.R. werden 
in der A} -Hypothese deshalb genau die Sachverhalte wie „es besteht ein Zusammen- 
hang“ oder „es bestehen Gruppenunterschiede“ etc. formuliert, denn gerade diese sind 
in der empirischen Forschung von Interesse. 

2. Die Nullhypothese A, Kann nicht verworfen werden — man findet also keinen schwar- 
zen Schwan, sondern nur weiße Schwäne in der Stichprobe. Wie wir wissen, ist dies 
kein ausreichender Beweis für die Gültigkeit der Nullhypothese 7/o. Die einzig zuläs- 
sige Schlussfolgerung ist, dass Al, nicht verworfen werden kann, was nicht gleichbe- 
deutend mit deren Beweis ist! 


Im Unterschied zu Poppers Schwänen liegt die Besonderheit des statistischen Testens 
nun darin, dass die Entscheidung für die Hypothese 77, immer mit einer vom Forscher 
festgelegten maximalen Fehlerwahrscheinlichkeit & einhergeht. Während die Existenz ei- 
nes schwarzen Schwanes mit 100 %-iger Sicherheit die ausschließliche Existenz weißer 
Schwäne - also A, - widerlegt, erfolgt beim statistischen Testen die Annahme von 7; 
nur mit einer festgelegten Sicherheit von (1 — «), die 1.d.R. zwar nahe bei 100 %, aber 
eben doch darunter liegt. Diese Sicherheit wird als Sicherheitswahrscheinlichkeit (engl.: 
confidence level) bezeichnet. In der empirischen Forschung sollte man deshalb strengge- 
nommen nie von einem statistischen Beweis, sondern nur von „Hypothesenunterstützung‘“ 
oder vom ‚„Verwerfen der Nullhypothese Ag“ sprechen. Die A-priori-Festlegung und offe- 
ne Kommunikation von Entscheidungsregeln, z.B. welche Sicherheit (1 — &) mindestens 
verlangt werden soll, ist deshalb von besonderer Bedeutung. 

Dies bringt uns zum Thema des Entscheidungsrisikos. Zunächst könnte es so aussehen, 
als würde man das Risiko einer Fehlentscheidung mit der Festlegung einer maximal zu- 
lässigen Fehlerwahrscheinlichkeit &, also einer Fehlerwahrscheinlichkeit von nahe null, 
vollständig in den Griff bekommen. Dies ist aber nicht der Fall, denn der «-Fehler — der 
häufig auch als Fehler erster Art (engl.: Type I Error) bezeichnet wird — setzt zwar der 
fälschlichen Ablehnung von A, eine Höchstgrenze. Dieser Fehler kann aber nur dann 
begangen werden, wenn man sich auch für A, entscheidet. Entscheidet man sich hinge- 
gen dazu, A, nicht zu verwerfen, so kann dies entweder richtiger- oder fälschlicherweise 
geschehen. Das Risiko, Ao irrtümlicherweise beizubehalten, bezeichnet man als Fehler 
zweiter Art (engl.: Type II Error) oder auch als 8-Fehler. Beide Handlungsalternativen 
bergen somit unterschiedliche Risiken: Entschließt man sich für die Ablehnung von Ah, 
ist diese Entscheidung mit einer maximalen Wahrscheinlichkeit von «& falsch. Entschließt 
man sich für die Beibehaltung von Ao, geschieht dies mit einem Risiko in Höhe des 
ß-Fehlers. Der Zusammenhang zwischen Testentscheidung einerseits und Realität an- 
dererseits kann Abb. 6.1 entnommen werden. Die Wahrscheinlichkeit für die korrekte 
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Tatbestand in der Realität 


Hy, trifft zu: EEE ZUE 
Patient hat AIDS Patient hat kein AIDS 
Kein Fehler ß-Fehler 


er Sicherheitswahrscheinlichkeit (1-0) Fehler 2. Art 


Den 12 [Entdeckt 99,99% der Kranken richtig] [Entdeckt mit Wahrscheinlichkeit ß 


Gesunde falsch] 
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a-Fehler Kein Fehler 
H,wird verworfen Fehler 1. Art Teststärke (1-ß) 
(entspricht Annahme von H}): 
Diagnose kein AIDS [Entdeckt 0,01% der Kranken nicht] [Entdeckt mit Wahrscheinlichkeit (1-ß) 
Gesunde richtig] 





Abb. 6.1 Fehlerwahrscheinlichkeiten bei Hypothesentests 


Ablehnung von Ang in der Höhe von (1—ß), bezeichnet man übrigens als Teststärke (engl.: 
power). 

Der Unterschied des Fehlers erster und zweiter Art soll anhand eines Aids-Tests ge- 
nauer erklärt werden: Der Student Müller muss im Rahmen seines Auslandsstudiums 
für sein Visa einen Aidstest vorlegen. Diesen lässt er von seinem Hausarzt durchführen. 
Nach drei Wochen erfährt er, dass sein Aıdstest positiv ausgefallen ist. Auf die Frage, 
mit welcher Sicherheit er nun wirklich Aids habe, blättert sein - statistisch leider nicht 
so geschult — Hausarzt im Beipackzettel und sagt, der Test habe bei der Erkennung von 
kranken Patienten eine Genauigkeit von (1 — «&) = 99,99%. Das sei dann wohl auch die 
Wahrscheinlichkeit für eine Aidserkrankung des Studenten Müller. 

Völlig aufgebracht sucht Student Müller deshalb eine Aidsberatung auf, bei dem ıhm 
zunächst einmal folgendes erklärt wird: Der Test definiert den schwerwiegendsten «&- 
Fehler als die Diagnose ‚Aj: Der Patient ist gesund“, obwohl in Wirklichkeit ‚„7o: Patient 
ist an AIDS erkrankt“ gilt: 


a& = P(H, angenommen] Ho trifft zu) = 0,01 %. (6.1) 


Da aber Student Müller die Entscheidung ‚Flo: Der Patient ist erkrankt‘ mitgeteilt worden 
ist, kann der «-Fehler gar nicht mehr eintreten, sondern nur noch der $-Fehler. Dessen 
Größe ist dem Beipackzettel nicht entnehmbar. Er liegt übrigens bei Tests, die Kranke 
und Gesunde mit einer Wahrscheinlichkeit von 99,99 % richtig diagnostizieren bei ß = 
50 %! Erst jetzt wird dem Studenten Müller die Bedeutung der zwei Fehlerarten klar, von 
denen sein Statistikprofessor immer gesprochen hat. Erst ein weiterer Aidstest würde die 
Unsicherheit stark reduzieren, denn die Wahrscheinlichkeit einer HIV-Infektion liegt bei 
zwei aufeinanderfolgenden positiven Tests bei rund 99,8 Prozent. 
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f(x) Blutwertverteilung | Blutwertverteilung 
Gesunder Kranker 






H, Hypothese: Person gesund! H, Hypothese: Person erkrankt 
FEN: 
Grenze, bis zu der die Diagnose 

Gesund erstellt wird 


Abb. 6.2 Darstellung von Fehlerwahrscheinlichkeiten (Bsp.: Krankheitsdiagnose) 


Wie verhalten sich &-Fehler und ß-Fehler nun zueinander? Die Größe des &-Fehlers 
gibt keine direkte Auskunft über den Fehler der fälschlichen Beibehaltung von Fo. Den- 
noch wird durch das Setzen des «-Fehlers automatisch die Größe des ß-Fehlers festgelegt: 
In Abb. 6.2 sind beispielhaft die Blutwertverteilungen von gesunden und kranken Patien- 
ten dargestellt. Es ist zu erkennen, dass die Blutwerte kranker Patienten tendenziell nach 
rechts verschoben sind. Aber auch gesunde Patienten können erhöhte Blutwerte aufwei- 
sen, weshalb sich die beiden Kurven überlappen. Legt man nun eine Grenze fest, ab der 
eine Krankheit diagnostiziert wird, geschieht dies für einen Teil der Gesunden zu Un- 
recht (-Fehler). Ein Teil der Erkrankten wird hingegen fälschlicherweise nicht erkannt 
(«-Fehler). Möchte man nun den «a-Fehler verkleinern, indem man die Grenze, ab der man 
eine Krankheit diagnostiziert, nach links verschiebt, erhöht sich automatisch der ß-Fehler. 
Je kleiner der «-Fehler gewählt wird, umso größer wird also tendenziell der ß-Fehler und 
vice versa. Somit lassen sich nicht alle Entscheidungsrisiken eines Tests einfach reduzie- 
ren.! 

Kommen wir nun zu der Frage, welches statistische Testverfahren in welcher Situation 
anzuwenden ist. Letztlich ist diese Entscheidung abhängig vom Forschungsziel: Steht die 
Entdeckung signifikanter Zusammenhänge zweier Variablen im Vordergrund der Unter- 
suchung, so spricht man vom Testen von Zusammenhangshypothesen. Besteht beispiels- 
weise ein Zusammenhang zwischen den Variablen Geschlecht und Einkommen? Geprüft 
wird also: 


Ho: Es besteht kein Zusammenhang zwischen Geschlecht und Einkommen. 
Hy}: Es besteht ein Zusammenhang zwischen Geschlecht und Einkommen. 


! Eine mögliche Maßnahme stellt in der Praxis die Erhöhung des Stichprobenumfanges dar. Hier- 
durch erhöht sich die Schätzgenauigkeit, sodass der Überlappungsbereich der beiden Verteilungen 
kleiner wird. 
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Abhängige (Gepaarte) Stichprobe Unabhängige Stichprobe 
Werbemaßnahme | Werbemaßnahme 
ee 
IT Stichprobe lässt sich mit Hilfe der 


Messreihen über die Person miteinander Gruppierungsvariablen in zwei unabhängige 
Verbunden, also „abhängig voneinander“. Teilstichproben (M/W) zerlegen. 













Abb. 6.3 Datenstruktur unabhängiger und abhängiger Stichproben 


Statistikpakete liefern für Zusammenhangsmaße sogenannte p-Werte (engl.: p-values), 
welche Auskunft darüber geben, mit welcher Wahrscheinlichkeit man sich irrt, wenn man 
von einem Zusammenhang der Variablen ausgeht. 

In der Praxis besitzen aber Unterschiedshypothesen weitaus mehr Bedeutung, weshalb 
wir uns im weiteren Verlauf auf diese konzentrieren werden. Dabei wird zwischen Tests 
für abhängige Stichproben (engl.: dependent samples) und Tests für unabhängige Stich- 
proben (engl.: independent samples) unterschieden. Erstere Tests beantworten die Frage, 
ob sich die Messwerte mindestens zweier Messreihen unterscheiden. Die einzelnen Wer- 
te der Messreihen sind jeweils einer Person oder einem Objekt zugeordnet. Handelt es 
sich um genau zwei Messreihen spricht man deshalb auch von gepaarten Stichproben 
(engl.: paired sample). Ein typisches Beispiel ist die Präferenzmessung vor und nach ei- 
ner Werbemaßnahme (Messwiederholung). Es liegen für jede Person - also für jede Zeile 
im Datensatz — zwei (gepaarte) Werte vor und es interessiert die Frage, ob sich die Durch- 
schnittswerte der beiden Messreihen signifikant voneinander unterscheiden (vgl. linke 
Grafik in Abb. 6.3). Geprüft wird in diesem Fall: 


Ho: Die Präferenzen der Zielgruppe unterscheiden sich vor und nach der Werbemaßnah- 
me nicht. 

Hy: Die Präferenzen der Zielgruppe unterscheiden sich vor und nach der Werbemaßnah- 
me. 


Ein Test für unabhängige Stichproben beantwortet z.B. die Frage, ob sich der Mittelwert 
von Gruppen unterscheidet. Es liegt also eine Variable vor, die den Datensatz in min- 
destens zwei (nicht unbedingt gleich große) Gruppen unterteilt. Für eine weitere Variable 
werden die gruppenspezifischen Mittelwerte gebildet und überprüft, ob sie sich signifikant 
voneinander unterscheiden. Diese Testverfahren werden unabhängig genannt, weil die 
Gesamtstichprobe mit Hilfe der Gruppierungsvariablen in unabhängige Unterstichproben 
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aufgeteilt werden kann. Ein Beispiel wäre die Fragestellung, ob sich die Präferenzen für 
eine Werbemaßnahme zwischen Männern und Frauen unterscheiden (vgl. rechte Grafik in 
Abb. 6.3). Geprüft wird: 


Ho: Die Präferenzen zwischen Männern und Frauen für die Werbemaßnahme unterschei- 
den sich nicht. 

H,: Die Präferenzen zwischen Männern und Frauen für die Werbemaßnahme unterschei- 
den sich. 


Erfüllen die Daten bestimmte Verteilungsannahmen - i1.d.R. die der Normalverteilung 
— spricht man von parametrischen Testverfahren (engl.: parametric tests), ansonsten von 
nicht-parametrischen Testverfahren (engl.: nonparametric tests). Liegen nominal- oder or- 
dinalskalierte Daten vor, eignen sich 1. d. R. nur nicht-parametrische Testverfahren. 

Zusammenfassend lässt sich somit feststellen, dass es bei der Frage, welcher Test 
angewendet werden sollte, keine allgemein gültige Antwort gibt. Das anzuwendende Ver- 
fahren ist abhängig vom Forschungsziel, vom Skalenniveau und von der Verteilung der 
verwendeten Daten. Die wichtigsten Testverfahren untersuchen den Tatbestand, ob sich 
Parameter zur Bestimmung der zentralen Tendenz voneinander unterscheiden. Die wich- 
tigsten Kennwerte zur Beschreibung der zentralen Tendenz sind das arıthmetische Mittel, 
der Modalwert und der Median. Wann welches Verfahren dabei zur Anwendung kommt, 
istin Abb. 6.4 wiedergegeben. Die Verfahren werden im Einzelnen in den Abschn. 6.1 bis 
Abschn. 6.4 vorgestellt. 


6.1 Tests für eine Stichprobe 
6.1.1 Einstichproben-Gauß-Test (o bekannt) 


Anhand des Einstichproben-Gauß-Tests (z-Tests) und des Einstichproben-t-Tests wollen 
wir die durchzuführenden Schritte eines Hypothesentests genauer beleuchten. Betrachten 
wir zunächst folgendes Beispiel: Ein Reifenhersteller hat die Mischung eines seiner Reifen 
verändert. Vom alten Modell kannte man aus Erfahrung die durchschnittliche Laufleistung 
Wo = 40.000 km bei einer Standardabweichung von o9 = 2000 km. Die Frage ist: Hat sich 
durch die neue Reifenmischung die durchschnittliche Laufleistung signifikant verändert’? 


1. Schritt: Formulierung der Hypothesen 

In einem ersten Schritt ıst somit festzulegen, ob es sich bei der Fragestellung um einen 
zweiseitigen (engl.: two-tailed test) oder um einen einseitigen Hypothesentest (engl.: one- 
tailed test) handelt. Da die Laufleistung sowohl gestiegen als auch gesunken sein Kann, 
handelt es sich um einen zweiseitigen Hypothesentest. Die Hypothesen lauten dann wie 
folgt: 


Ho: u = Yo = 40.000 km 
Hı: u # Yo = 40.000 km 
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Wäre die Fragestellung gewesen, ob sich die Laufleistung signifikant erhöht hat, wäre es 
nur um eine Wirkungsrichtung gegangen, also um einen einseitigen Hypothesentest. Die 
Hypothesen dafür wären: 


Ho: u < Ho = 40.000 km 
H,: u > Yo = 40.000 km 


Der Idee Poppers folgend, ist die zu beweisende Annahme, dass die Laufleistung steigt, 
in der Alternativhypothese 7} formuliert. Im umgekehrten Fall, also bei der Frage, ob die 
Laufleistung zurückgegangen ist, hätten die Hypothesen wie folgt ausgesehen: 


Ho: u Z Ho = 40.000 km 
Hı: u < Yo = 40.000 km 


2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 
Zur Überprüfung der Hypothese wird nun eine Stichprobe vom Umfang n = 100 gezo- 
gen. Die durchschnittliche — und als normalverteilt angenommene - Laufleistung in dieser 
Stichprobe liegt bei x = 40.200 km. 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder annähernd metrisches Skalenniveau \ 
Es liegt eine Zufallsstichprobe vor V 


Variable ist in der Grundgesamtheit annähernd normalver-  V/ 
teilt oder die Stichprobe ist groß genug (n > 30) 


Varianz der Grundgesamtheit ist bekannt v 


5. Schritt: Bestimmung der kritischen Testwerte 

Kommen wir an dieser Stelle zur zweiseitigen Fragestellung zurück. Sollte die Annahme, 
dass Ao: u = Ho = 40.000 silt, zutreffen, dann müsste mit gegebener Sicherheitswahr- 
scheinlichkeit (1 —«&) der Mittelwert der Stichprobe in einem Wahrscheinlichkeitsintervall 
mit gegebener Unter- und Obergrenze liegen (vgl. Abb. 6.5): 


Pure) =e1-K: (6.2) 


6.1 Tests für eine Stichprobe 147 





a/2=0,025 a/2=0,025 


Ablehnung |+— Keine Ablehnung von H, —| Ablehnung 


von H, von H, 
Kritische Kritische 
Untergrenze Obergrenze 
C,= 39.608 C, = 40.392 


Abb. 6.5 Ablehnungsbereiche für die Nullhypothese 


In Abb. 6.5 entsprechen diese Grenzen den kritischen Werten an den Rändern der Nor- 
malverteilung. Standardisieren wir nun die Verteilung, stellen die Quantile —z(1_u/>2) und 
+Z(1-a/2) die Unter- bzw. Obergrenze des jeweils transformierten z-Wertes dar: 





P (-213 2 —— < ts) di (6.3) 
x 


Durch einfache Umformung ergibt sich: 
P (wo — Zı-4 x <SX< Ho + 21-307) =1-e. (6.4) 


Wir können nun die aus der Hypothese und aus der Stichprobe bekannten Werte einsetzen. 
Dabei entspricht: 


e ‚io dem in A, angenommenen hypothetischen Wert von uo = 40.000 km; 
e co; dem Standardfehler, der sich entweder aus einer bekannten Standardabweichung der 


Grundgesamtheit mit 


oO 
0x = /n (6.5) 


ergibt oder sich als Schätzwert durch die Standardabweichung der Stichprobe mit 


S EeOTr 
u (6.6) 
Rn 


ermitteln lässt (siehe zu letzterem Abschn. 6.1.2); 
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e a dem Wert für die Fehlerwahrscheinlichkeit. Dieser Wert wurde von uns aufa = 5% 
festgelegt. Da es sich um einen zweiseitigen Test handelt, verteilt sich die Irrtums- 
wahrscheinlichkeit jeweils hälftig auf die rechte und linke Seite der Verteilung, sodass 
folgendes gilt: 





40. zZ X 40. AZ ‚9 R 


2 ( 000 — 1,96 euer <x < 40.000 + 1,96 ı ) 0,95 (6.8) 
= X <SN. a 
100 „100 


P (39.608 < x < 40.392) = 0,95. (6.9) 





6. Schritt: Bestimmung des empirischen Testwerts 
Die durchschnittliche Laufleistung aus der Stichprobe beträgt 40.200 km. 


7. Schritt: Testentscheidung 

Unter der Annahme von Fo, dass der Mittelwert der Verteilung bei uo = 40.000 liest, 
ergibt sich in 95 % der Fälle ein Stichprobenmittel, das zwischen den kritischen Gren- 
zen 39.608 und 40.392 liegt. Analog sind die Ablehnungsbereiche für Ag die Intervalle 
[-00; 39.608] und ]40.392; oo]. Der durch die Stichprobe ermittelte Wert x = 40.200 fällt 
nicht in den Ablehnungsbereich von Ao, weshalb 7/9 nicht verworfen werden kann. 

In Abb. 6.6 wird die Berechnung von Einstichproben-Tests unter verschiedenen Be- 
dingungen als Flussdiagramm zusammenfassend dargestellt. Dabei wird nochmals genau 
unterschieden, ob die Standardabweichung der Grundgesamtheit von vornherein bekannt 
ist (vgl. linken Ast in Abb. 6.6) oder nicht (vgl. rechten Ast in Abb. 6.6). Im ersten Fall 
spricht man von einem z-Test, im zweiten Fall von einem 1-Test. Der oben durchgeführte 
Test entspricht somit dem des z-Tests. 


6.1.2 Einstichproben-t-Test (co unbekannt) 


Auch den 7-Test wollen wir mit Hilfe eines Beispiels erarbeiten: Ein Forscherteam hat eine 
neue Antriebstechnik für Lkws entwickelt, die angeblich weniger Dieselkraftstoff benötigt 
als die alte Antriebstechnologie. Im Rahmen einer Versuchsreihe mit 20 Testfahrzeugen 
ergibt sich ein Verbrauch von durchschnittlich 15 Litern bei einer theoretischen Varianz 
von 25 Litern?. Im Gegensatz zum Beispiel aus Abschn. 6.1.1 ist hier zwar die Varianz der 
Stichprobe, aber nicht die Varianz der Grundgesamtheit bekannt, weshalb später auch der 
t-Test und nicht der Gauß-Test zur Anwendung kommt. Der Treibstoffverbrauch kann als 
normalverteilt angenommen werden. Die Geschäftsleitung möchte die neue Technologie 
nur dann einführen, wenn sie mit 99,5 %-iger Sicherheit davon ausgehen kann, dass der 
Treibstoffverbrauch tatsächlich geringer als mit der alten Antriebstechnologie ist. Die alte 
Antriebstechnologie hatte einen Durchschnittsverbrauch von 17,5 Litern. Es soll statis- 
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tisch untersucht werden, ob die Forderung der Geschäftsführung gehalten werden kann. 
Analog zum z-Test sind folgende Schritte zu durchlaufen: 


1. Schritt: Formulierung der Hypothesen 

Es handelt sich bei der vorliegenden Fragestellung um einen einseitigen Hypothesentest, 
denn die Geschäftsführung will die neue Technologie einführen, wenn diese nachweislich 
weniger verbraucht. Die A}-Hypothese muss nun so formuliert werden, dass der «-Fehler 
den schwerwiegenden Fehler im Entscheidungsprozess darstellt. Mögliche Hypothesen- 
kombinationen aus Sicht der Geschäftsführung sind: 


Ho: u < uo = 17,5 Liter versus A: u > uo = 17,5 Liter 


In diesem Fall entspräche der «-Fehler der Beibehaltung der alten Technologie (A: u > 
Yo = 17,5 Liter), obwohl die neue effizienter wäre (Ao: u < Wo = 17,3). 


Ho: k > Bo = 17,5 Liter versus A: a < io = 17,5 Liter 


Hier entspräche der «-Fehler dem der Entscheidung für die neue Technologie (A: u < 
Yo = 17,5 Liter), obwohl sıe nicht effizienter ist (Ag: u 2 vo = 17,5). 

Der zweite Fall ist aus Sicht der Geschäftsführung der „schwerwiegendere Fehler“ 
(a-Fehler), da auf eine bestenfalls gleich gute Technologie gesetzt wird. Die Geschäfts- 
führung wird deshalb diesen Fehler kontrollieren wollen und dessen Wahrscheinlichkeit 
mit « festlegen. Entsprechend ist folgendes zu prüfen: 


Ho: u zZ vo = 17,5 Liter versus A}: u < vo = 17,5 Liter 


2. Schritt: Festlegung des Signifikanzniveaus «& 
Der maximal zulässige «-Fehler ist von der Geschäftsleitung auf x = 0,5 % festgelegt. 


3. Schritt: Ziehung der Stichprobe 
Es wurde eine Stichprobe im Umfang von n=20 gezogen. Die Daten sind annähernd nor- 
malverteilt. 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder annähernd metrisches Skalenniveau \ 
Es liegt eine Zufallsstichprobe vor V 


Variable ist in der Grundgesamtheit annähernd normalver- 
teilt oder die Stichprobe ist groß genug (n > 30) 


Varianz der Grundgesamtheit ist unbekannt V 
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5. Schritt: Bestimmung der kritischen Testwerte 

Auf Basis von Abb. 6.6 erfolgen nun die Berechnungen des Einstichproben-t-Tests: Die 
Varianz der Grundgesamtheit ist unbekannt und die Daten gelten als annähernd normal- 
verteilt. Es handelt sich um eine Stichprobe ohne Zurücklegen, allerdings kann die Größe 
der Grundgesamtheit N als sehr groß angenommen werden, sodass sich aufgrund von 
v < 0,05 der Standardfehler wie folgt berechnet: 


Sie, 5 
Sn (6.10) 


m oo 


Da (n — 1) nicht größer als 30 ist, kann 7, nicht verworfen werden, wenn x im Intervall 
[to — 2,6%; 00] liegt. Nach Einsetzen und Berechnung ergibt sich: 





[17,5 — 1995 : 1,118; 00] (6.11) 
— [17,5 — 2,861 - 1,118; 00] (6.12) 
= [14,3; 0]. (6.13) 


6. Schritt: Bestimmung des empirischen Testwerts 

Die Stichprobe ergibt einen Durchschnittsverbrauch von x = 15 Litern (Testgröße) bei 
einer theoretischen Varianz von So — 25 Litern’. 

7. Schritt: Testentscheidung 

Bei gegebenem Signifikanzniveau von «@ = 0,5%, wird Ag: u 2 Yo = 17,5 Liter nicht 
abgelehnt, da der Mittelwert der Stichprobe x = 15 Liter in den Bereich fällt, der eine 
Ablehnung von Ao nicht erlaubt. Es ist statistisch somit nicht bewiesen, dass der neue 
Antrieb weniger als 17,5 Liter benötigt. 


6.13 Überschreitungswahrscheinlichkeit p 


An dieser Stelle kann man sich die Frage stellen, wıe groß die Wahrscheinlichkeit einer 

irrtümlichen Annahme von AH) tatsächlich ist. Diese wird auch als Überschreitungswahr- 

scheinlichkeit oder p-Wert (engl.: p-value) bezeichnet und gibt an, wıe wahrscheinlich 

die empirische Prüfgröße - in unserem Fall x - unter der Annahme der Nullhypothese ist. 

Diese p-Werte berechnen sich bei zweiseitigem Hypothesentest mit 

a )) (6.14) 
0% 











De 2: (i = < Ikritisch = 
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und bei einseitigen Hypothesentests mit 








y- 
Piinks = P < Ikritisch = ze) für Ai: < Ho (6.15) 

X 

5 x — Uo i 
Prechts = ( =; (" a — )) für Aı:a > Wo. (6.16) 
X 
Für unser einseitiges Beispiel bedeutet dies: 
ler . J5-4175 (6.17) 
Plinks = — kritisch — 1.118 . 

Pinks = P (t” < fkriviscn = —2,236) (6.18) 


Aus der 1-Tabelle ergibt sich bein = 19 Freiheitsgraden für den Wert Iritiscn = (- 2,236) 
ein p-Wert für einen einseitigen Test, der zwischen (1—0,975) = 2,5 % und (1—0,99) = 
1 % liegt. Mit Excel kann dieser Wert mit dem Befehl =(T: VERT(-2.236,19;1)) mit 1,88 % 
genau bestimmt werden. Für den p-Wert des linksseitigen Tests ergibt sich entsprechend: 


Pins = P (f” < Ikrivisen = —2,236) = 1,88 %. (6.19) 


Das bedeutet, dass man sich in p = 1,88% der Fälle irrt, wenn man auf Basis der 
Stichprobe davon ausgeht, dass die neue Antriebstechnologie effizienter ist, also A: 
u < Yo = 17,5 Liter angenommen wird. Alle Statistikpakete weisen gemeinsam mit der 
Teststatistik den p-Wert aus, sodass die Testentscheidung auch auf dieser Basis getroffen 
werden kann: Ist der p-Wert kleiner als das vorab festgelegte «, wird Fo verworfen und 
vice versa. 


6.1.4 Einstichproben-i-Test mit SPSS, Stata und Excel 


Ein Marktforscher möchte mit 95 %-iger Sicherheit entscheiden, ob sich die wöchentli- 
chen Absatzzahlen von drei unterschiedlichen Firmen signifikant vom Wert 40.000 ver- 
kaufter Produkte unterscheiden. Hierzu erhebt er über 20 Wochen die Absätze der jewei- 
ligen Produkte. Die Daten liegen als SPSS-Datei (1_test.sav), als Stata-Dateı (1_test.dta) 
und als Excel-Datei (t_test.xis) vor und sind im rechten Teil in Abb. 6.7 dargestellt. 

Die Befehlsfolge in SPSS lautet Analyze > Compare Means — One-Sample T 
Test ...” Es öffnet sich das in Abb. 6.7 links dargestellte Fenster. Der zu testende 
Vergleichswert — in unserem Fall 40.000 - ist unter Test Value anzugeben. Unter Test 
Variables List erfolgt die Angabe der zu testenden Variablen — in unserem Fall sind das 
die Absatzzahlen der drei Firmen. 


* In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren — Mittelwerte Verglei- 
chen — t-Test bei einer Stichprobe ... 
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Mit Stata bestehen zwei Möglichkeiten, den Einstichproben-t-Test durchzuführen. 
Sınd die Parameter wo, x und « bereits berechnet, können über die Befehlsfolge Sta- 
tistics > Summaries, tables, and tests > Classical tests of hypotheses > One-Sample 
mean comparison calculator die p-Werte des einseitigen und der beiden zweiseitigen 
Tests berechnet werden (vgl. linkes Fenster in Abb. 6.8). Sollen die Parameter aus einem 
Datensatz berechnet und danach der Test durchgeführt werden, lautet die Befehlsfolge: 
Statistics > Summaries, tables, and tests > Classical tests of hypotheses > One-Sample 
mean comparison test (vgl. rechtes Fenster in Abb. 6.8). Die entstehenden Outputs sind 
bei beiden Vorgehensweisen identisch (vgl. Abb. 6.8 unten). 

Sind in Excel mit dem Add-Ins-Manager die Module Analyse-Funktionen und Analyse- 
Funktionen-VBA dauerhaft aktiviert,” kann im Menüpunkt Daten dıe Schaltfläche Daten- 
analyse gewählt und die Funktion Zweistichproben f-Test bei abhängigen Stichproben 
ausgewählt werden. 

Diese Auswahl erfolgt, obwohl wir eigentlich einen Einstichproben-t-Test durch- 
führen wollen. Excel selbst bietet keine gesonderte Prozedur zur Berechnung eines 
Einstichproben-7-Tests an, sodass wir uns eines kleinen Tricks bedienen müssen: In das 
Feld Bereich Variable A wırd der Datenbereich der Testvariablen - also z.B. die Absätze 
der Firma 1 - angegeben. Für jeden der Testwerte wird in einer anderen beliebigen Spalte 
nun der zu prüfende Testwert uo eingegeben und im Feld Bereich Variable B angegeben. 
In unserem Beispiel befinden sich alle Werte für to = 40.000 in der Spalte D (vgl. 
Abb. 6.9). 

Die Mittelwerte der drei Firmen liegen bei 40.114.6, 41.941,65 und 40.025,15. In 
52,4% der Fälle irrt man sich, wenn man davon ausgeht, dass sich der Absatz der Fir- 
ma 1 vom Wert 40.000 unterscheidet. Bei Firma 3 liegt der p-Wert bei 27,4%. Beide 
Werte liegen somit über dem Grenzwert von « = 0,05, sodass Au nicht verworfen wer- 
den kann. Weder die Absatzzahlen von Firma 1 noch die von Firma 3 unterscheiden sıch 
statistisch signifikant von 40.000. Der Absatz von Firma 2 unterscheidet sich allerdings 
statistisch signifikant von 40.000, denn die zweiseitige Signifikanz liegt bei 0.000, sodass 
der p-Wert kleiner als p = 0,5 % sein muss. Wäre der p-Wert größer als 0,5 %, hätte die 
Software einen Wert von mindestens 0,001 ausgegeben. 

Die Sıgnifikanz des einseitigen Tests ist in SPSS nicht angegeben. Istx < wo und soll 
Hı: u < uo getestet werden, ist die zweiseitige Signifikanz zu halbieren. Stellt man sich 
beispielsweise die Frage, ob der Absatz von Firma 2 kleiner als 42.000 ist, ergibt sich 
zunächst ein zweiseitiger p-Wert von p = 13.1%. Mitx = 41.941,6 < uo = 42.000 irrt 
man sıch in 6.55 % der Fälle, wenn man davon ausgeht, dass der Absatz kleiner als 42.000 
ist. Der einseitige Test (A: u < uo = 40.000) wäre auf dem Niveau & = 5 % wiederum 
nicht statistisch signifikant. Analog kann bei A}: u > ko und x > uo vorgegangen 
werden. 


® Für Excel 2010 ist dieser über die Schaltflächenkombination Datei > Optionen — Add-ins — 
Gehe zu erreichbar. 
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6.2 Tests für zwei abhängige Stichproben 
6.2.1 t-Test für gepaarte/abhängige Stichproben 


Im vorangegangen Abschnitt ging es um die Fragestellung, ob sich der Erwartungswert 
einer Grundgesamtheit u signifikant von einem hypothetisch festgelegten Wert uüo unter- 
scheidet. Die damit verbundenen Hypothesen lauteten Ao: u = uo versus AH: u # ko. 
In der empirischen Praxis begegnen wir häufig aber auch Fragestellungen, bei denen Mit- 
telwerte zwischen zwei Messreihen verglichen werden. Wenn es dabei um abhängige 
Stichproben geht, handelt es sich nicht selten um „Vorher-Nachher“ Analysen, also um 
Fragestellungen mit Messwiederholungen. Hierzu zwei Beispiele: 


e Die Präferenz von einzelnen Kunden für ein bestimmtes Produkt wird vor und nach 
einer Werbemaßnahme gemessen. Unterscheidet sich die durchschnittliche Präferenz 
vor (41) und nach (>) der Werbemaßnahme, hat die Werbemaßnahme also eine sıgni- 
fikante Wirkung? 

e Handwerker werden gebeten, einen bestimmten Arbeitsschritt mit zwei unterschiedli- 
chen Maschinen durchzuführen. Unterscheiden sich die durchschnittlichen Dauern der 
Arbeit an den beiden Maschinen (u # uU)? 


Manchmal werden aber auch zwei Gruppen miteinander verglichen, deren Subjekte oder 
Objekte paarweise miteinander verbunden sind. So kann sich beispielsweise die Frage 
stellen, ob sıch bei Paaren die durchschnittliche Körpergröße unterscheidet. Die Werte der 
beiden Messreihen gehören auch hier zu einer Beobachtungseinheit (nämlich dem Paar) 
und sie sind deshalb paarweise — also im Datensatz nebeneinander - angeordnet. 

Letztlich geht es aber immer um die Überprüfung der Hypothese, ob sich der Mit- 
telwert einer beobachteten Variablenreihe vom Mittelwert einer anderen Variablenreihe 
signifikant unterscheidet. Betrachten wir hierzu folgendes Beispiel: Es soll untersucht 
werden, ob sich in 32 ausgesuchten Testmärkten die Verkaufspreise zweier Kaffeesorten 
im Durchschnitt signifikant voneinander unterscheiden. Die Datenlage ist in Abb. 6.10 
wiedergegeben. 

Zur Lösung sind die nachfolgenden Schritte zu durchlaufen: 


1. Schritt: Formulierung der Hypothesen 

Es handelt sich beı der vorliegenden Fragestellung um einen zweiseitigen Hypothesentest, 
bei dem der Unterschied der beiden Mittelwerte untersucht werden soll. Die Hypothesen 
lauten in diesem Fall: 


Ho: uı = 42 > Ho: yı -U2 = 0 
Hi: vı #42 > Hı:pı - m FO 
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Preisdifferenz (d,) 


Verkaufsstelle Preis Sorte1 PreisSorte2 (Produkt 1- Produkt 2) 
1 3,22 3.01 0.21 
2 3.09 3.16 -0.07 
3 3.09 2.99 0.10 
4 3.40 3,39 0.01 
5 3.09 3,23 -0.14 
6 3.19 3.05 0.14 
7 2,99 2.88 0.11 
8 2.65 2.57 0.08 
9 3.09 2.99 0.10 
10 3.09 3.21 -0.12 
11 3.19 3.05 0.14 
12 3.09 3.06 0.03 
13 2.89 2.81 0.08 
14 2.99 2.96 0.03 
15 2.99 2.88 0.11 
16 2.97 2.94 0.03 
17 2:97 2.94 0.03 
18 3.09 3.20 -0.11 
19 2.59 2,73 -0.14 
20 2.99 2.87 0.12 
21 2.89 2.89 0.00 
22 3.09 3.123 -0.04 
23 2.59 2.59 0.00 
24 2.89 2.93 -0.04 
25 2,79 2.80 -0.01 
26 2.99 2.96 0.03 
27 2.99 3.07 -0.08 
28 2.79 2.80 -0.01 
29 291 2.90 0.01 
30 3.04 3.02 0.02 
31 2.69 2.57 0.12 
32 2.72 2.50 0.22 

Mittelwert 2.9700 2.9400 0.0300 
Standardabweichung 0.1872 0.2040 0.0940 


Abb. 6.10 Beispiel für Preise zweier Kaffeesorten in 32 Testmärkten 


Würde die Fragestellung lauten, ob Produkt 1 im Durchschnitt signifikant teurer ist, würde 
es sich um einen einseitigen Hypothesentest handeln und die Hypothesen müssten wie 
folgt formuliert werden: 


Ho: kı < Ua: Produktpreis 1 ist kleiner oder gleich dem Produktpreis 2 versus 
Hj: uı > U>: Produktpreis 1 ist größer als der Produktpreis 2 


Der zu beweisende Tatbestand würde somit wiederum in der 77, -Hypothese festgelegt. 
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2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 

Es wurde eine Zufallsstichprobe im Umfang von n = 32 gezogen. Wie beim Einstichpro- 
ben-/-Test muss auch beim gepaarten t-Test von einer Normalverteilung der Differenz- 
mittelwerte der Preise in der Grundgesamtheit ausgegangen werden können. Auf diese 
Annahme kann nur verzichtet werden, wenn die Stichprobe mit n > 30 groß genug ist. 
Sollten keine der beiden Bedingungen erfüllt sein, muss auf den Wilcoxon-Vorzeichen- 
Rang-Test zurückgegriffen werden (vgl. Abschn. 6.2.2). In unserem Beispiel ist die Stich- 
probe mit n = 32 Beobachtungen groß genug, um den 1-Test anwenden zu können. 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder annähernd metrisches Skalenniveau für \ 
beide Variablen 

Es liegt eine Zufallsstichprobe vor ‘ 
Variablen und Differenzwerte der beiden Variablen sind \ 


in der Grundgesamtheit annähernd normalverteilt oder die 
Stichprobe ist groß genug (n > 30) 


5. Schritt: Bestimmung des kritischen Testwerts 
Wird der zweiseitige Test von Hand berechnet, ist zunächst der theoretische t-Wert bei 
gegebenem Signifikanzniveau «@ zu bestimmen. Bei (n — 1) = 31 Freiheitsgraden ergibt 
sich für einen zweiseitigen Test — also &/2 auf jeder Seite der Verteilung — konservativ 
gerechnet ein theoretischer t-Wert von 151,5 7 2,042 (vgl. Abschn. 8.3). Eine genauere 
Tabelle hätte den Wert von 19155 = 2,0395 ergeben. 


6. Schritt: Bestimmung des empirischen Testwerts 

Die Differenz der beiden Mittelwerte folgt einer t-Verteilung mit n — 1 Freiheitsgraden. 
Zur Bestimmung des empirischen 1-Wertes der Stichprobe gilt deshalb folgende Berech- 
nungsformel: 


mi a) (6.20) 
/n 
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Der Wert für wu, entspricht dabei dem des erwarteten Preisunterschieds. Soll überprüft 
werden, ob beide Mittelwerte gleich groß sind, ist der erwartete Unterschied zwischen 
beiden Mittelwerten gleich Null (ua = O0). Die Berechnung des empirischen t-Wertes 
vereinfacht sıch dann wie folgt: 


A (6.21) 


sr | 8 


Die Stichprobe aus Abb. 6.10 ergibt eine durchschnittliche Preisdifferenz von 0,03 Geld- 

einheiten (GE): 

Yi_.d 0,96 
n 30 


d = — 0,03GE. (6.22) 


Das gleiche Ergebnis ergibt sich übrigens auch durch einfache Differenzbildung beider 
Mittelwerte. Es gilt also auch: 





(6.23) 
(6.24) 
Mit diesen Werten ergibt sich dann folgender empirischer 7-Wert: 
(q . ja) 0,03—0 
= - EI) 1,804. (6.25) 
Sd 0,0940 
Tr 732 


7. Schritt: Testentscheidung 
Liegt der kritische t-Wert über dem aus dem Datensatz ermittelten empirischen t-Wert 
ım Betrag, wird A, nicht verworfen, ansonsten doch. In unserem Fall kann 7/9 nicht ver- 
worfen werden, da der Betrag des empirischen t-Werts mit 1?! = | + 1,804| kleiner als 
der theoretisch geforderte Mindestwert 1fy055 = 2,0395 ist. Der Preisunterschied gilt bei 
gegebener Irrtumswahrscheinlichkeit von « < 0,05 somit als statistisch nicht signifikant. 
Erfolgt die Berechnung des gepaarten 7-Tests nicht von Hand, sondern mit Hilfe einer 
Statistiksoftware, so wird der p-Wert der empirischen Daten direkt angegeben. Dieser gıbt 
an, wie wahrscheinlich der empirische t-Wert unter Annahme der Nullhypothese lo ist, 
mit welcher Wahrscheinlichkeit man sich irrt, wenn man von einem Preisunterschied der 
beiden Produkte ausgeht. Liegt der p-Wert unter dem festgelegten Signifikanzniveau «, 
wird Fo verworfen. Diese Vorgehensweise wird in den folgenden Abschnitten gezeigt. 
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6.2.1.1 Berechnung des gepaarten {-Tests mit SPSS 

Anhand der Beispieldatei Kaffee.sav wollen wir den gepaarten t-Test durch die Befehls- 
folge Analyze — Compare Means — PairedSamples T Test .... berechnen.* Es öffnet 
sich die Dialogbox aus Abb. 6.11, ın der die beiden zu vergleichenden Variablen Preis_1 
und Preis_?2 per „drag and drop“ ın das Feld für Variablel und Variable2 gezogen werden. 
Nach Bestätigung durch OK ergeben sıch die Tabellen in Abb. 6.11. Die erste Tabel- 
le gibt die deskriptiven Parameter der beiden Variablen wieder, so auch deren Mittelwerte 
xı = 2,97 und x> = 2,94. Die Größe des Preisunterschieds lässt sich mit 0,03 der zweiten 
Tabelle entnehmen. Dort ist auch der empirische t-Wert mit 1,804 ausgewiesen. Mit einer 
95 %-ıgen Sicherheit liegt der wahre Preisunterschied in der Grundgesamtheit zwischen 
—0,00391 und 0,06391. Das entscheidende Ergebnis ist in der Spalte „Sig. (2-tailed)“ wie- 
dergegeben, in der für einen zweiseitigen Test ein p-Wert von p = 0,081 ausgewiesen ist. 
Man irrt somit in 8,1 % der Fälle, wenn man auf Basis der Stichprobe im Durchschnitt von 
einem Preisunterschied ausgeht. Dieser Wert ist größer als die festgelegten « = 5%. 

Wären die Hypothesen gerichtet formuliert gewesen, nämlich 


Ho: uı < Aa: Produktpreis 1 ist kleiner oder gleich dem Produktpreis 2 versus 
Hj: uı > U>: Produktpreis 1 ist größer als der Produktpreis 2 


müsste der ausgewiesene p-Wert durch 2 geteilt werden. In diesem Fall käme man zu 
dem Ergebnis, dass man sich in nur rund 4% der Fälle irrt, wenn man davon ausgeht, 
dass Produkt 1 im Durchschnitt teurer ist. In diesem Fall wäre das Ergebnis statistisch 
signifikant.” 


6.2.1.2 Berechnung des gepaarten /-Tests mit Stata 

Anhand der Beispieldatei Kaffee.dta wollen wir den gepaarten t-Test durch die Be- 
fehlsfolge Statistics > Summaries, tables, and tests > Classical tests of hypotheses > 
Mean-comparison test, paired data mit Stata berechnen. Es öffnet sich die Dialogbox 
aus Abb. 6.12, ın der die beiden zu vergleichenden Variablen Preis_l und Preis_2 ın das 
Feld für Variablel und Variable2 gezogen werden. Nach Bestätigung durch OK erge- 
ben sich die Tabellen in Abb. 6.12. Die Interpretation der Ergebnisse entspricht der des 
Abschn. 6.2.1.1. 


*In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren — Mittelwerte Verglei- 
chen — t-test bei verbundenen Stichproben ... 

> Eine sehr gute Darstellung über die Vorgehensweise in SPSS findet sich hier: https://www.youtube. 
com/watch?v=MJGk2sg4EZU. 

6 Eine sehr gute Darstellung über die Vorgehensweise in Stata findet sich hier: https://www.youtube. 
com/watch?v=ajzMeANAMzI. 
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Sen Poren STB 
Einfügen der beiden zu vergleichenden metrischen Test-Variablen. Main born 
Firsi vanable Secondvwarable 
Pre _Söre_1 " Pre Gore ” 
= = Conlcherse kensel 
r Do Cam Subma 


Standardfehler des Mittelwertunterschieds 
Standardabweichung des Mittelwertunterschieds. 
Mittelwertunterschied. 


; test Preis Sorte 1 = Preis -Jorke 2 


Mit einer 95%-igen Sicherheit liegt der 
Preisunterschied in der 
Grundgesamtheit zwischen -0,00391 





und 0,06391. 


























































































Paired t test 
Variable | Obs Mean Std. Er Std./Dev. [95% f. Intervall] 
a a a u a, +------------- -—- - - --—- a a a a aa a a a a a a a a a a ie a a a a a a a a a a a a 
Preis -1 | 32 2.9 033032 .1872035 2.90250 3.037494 
Preis -2 | 32 2.9 0360695 .2040398 3.013564 
a a a m +-------------- - - - - - - ----- --— a a a ae a a a a a a a a a a m m a m Ga Ya 
dicE | 32 03 0166256 .0940487 — 
aa Empirischer t- 
_ Wert. 
mean(dirf) = mean (Preis Sorte 1 - Preis sörte 2) 
Ho: mean(d f) = 0 degrees of freedom = 31 
Be le 
Ha: mean(diff) <O Ha: mean(diff) != Ha: mean (diff) > OD Freiheitsgrade. 
Pr(T < t) = 0.9596 Pr(|IT| > |t|) = 0.0809 Pr(T > t) = 0.0404 


p-Wert: Man irrt in 4 % der Fälle, wenn man 
davon ausgeht, dass Produkt 1 teurer ist. 


p-Wert: Man irrt in 8,1 % der Fälle, wenn man von einem Preisunterschied ausgeht. 











p-Wert: Man irrt in 96 % der Fälle, wenn man davon ausgeht, dass Produkt 2 teurer ist. 


Abb. 6.12 Gepaarter t-Test mit Stata 


6.2.1.3 Berechnung des gepaarten /-Tests mit Excel 

Mit Hilfe von Excel kann über den Menüpunkt Daten die Schaltfläche Datenanalyse und 
danach die Funktion Zweistichproben t-Test bei abhängigen Stichproben ausgewählt wer- 
den. Für die Beispieldatei Kaffee.xis öffnet sich die Dialogbox aus Abb. 6.13, ın der unter 
Bereich Variable A und Bereich Variable B zunächst die Bereiche der beiden Preisva- 
riablen eingegeben werden. Sind Spaltenüberschriften in den definierten Bereichen der 
beiden Variablen eingeschlossen, muss unter dem Menüpunkt Beschriftung angeklickt 
werden. Soll auf Gleichheit der Mittelwerte der beiden Variablen getestet werden, ist un- 
ter Hypothetische Differenz der Mittelwerte der Wert Null einzutragen. Nach Bestätigung 
durch OK ergibt sich die Ergebnistabelle aus Abb. 6.13.’ 


? Eine sehr gute Darstellung über die Vorgehensweise in Excel findet sich hier: https://www.youtube. 
com/watch?v=wy8GVt7ltyk. 
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fr . a m Ss 2 ——— Einfügen der beiden zu ver- 
Zweittichnenisen t- abhängigen Stichproben BE ü ö 
2 BEER sleichenden Test-Variablen. 
ı YWerkaslimels Preis Sorte 1 Preis Gore 3 la 
en 1 . m 2 | Da | 

: = a RE se — nn Hypothetische Differenz 
3 # 3.0 4.16 Bereich Yariable B= ges: | ei ” " 
a 3 3.09 2.39 = 
5 4 340 3.39 AN n 8 HER : : 
= = 4 2 Hpaihesche Differenz der Mittelwerte: : Beschriftung der Spalte ist 
T 6 3.19 3.08 a mit markiert worden. 
5 F 259 2.88 Alapua: 0.0 
5 5 2. dr 
10 9 09 2:9 en Festlegung von 0. 
1 10 3.09 3.2 Ausgababinekch: = 
2 1 ? 13 20 0 eu Tabea 
13 13 3.69 3.06 
14 13 2.89 2.81 ri ie 
15 14 2.599 2.56 _ = 
16 15 2.59 2.0 
i7 15 3.37 2.34 A n c 
18 T 247 2.4 Fi s m ai : k 
19 15 3.09 3.20 1 Zwenstichproben t-Test bei abhängigen Stichproben [Paarwergeichsteit] 
ei) 13 259 2.73 2 
#1 Fin] 2.59 2.87 3 Preis Sorte] Preis Sorte 2 
di 2 289 2.89 4 Mittelwert 2.97 2.94 
2 = 208 = 5 Varianz 0.0350 0.0416 
34 = 285 2.39 
3%, 24 239 2.93 6 Beobachtungen 34 32 
Sr in 1 30 en Be an 
7 3 2.90 2.96 8 Hypathetische Differenz der Mittelwerte 0 Anzahl der Freiheitsgrade. 
a 2 pi 9 Freiheitsgrade (df} 31°_— | Empirischer t-Wert. 
= Ei ie a 10 t-Statistik 1.804 
35 Fi] 2.31 2. ur 
+1 a Ad 3.00 11 PiT<=t) einseitig 0.0404 
33 31 3.60 7,57 12 Kntiecher t-Wert be einderiger t-Test 1.6955 
33 33 2.72 2.50 13 Plfcei) zweiseitig D.C 

14 Kritischer t-\Wert bei rweiseitigem t-Test 2.0395 


Theoretischer t-Wert eines zweiseitigen Tests bei festgelegtem 0. 


p-Wert: Man irrt in 8,1 % der Fälle, wenn man von einem Preisunterschied ausgeht. 


Theoretischer t-Wert eines einseitigen Tests bei festgelegtem 0. 
Man irrt in 4 % der Fälle, wenn man davon ausgeht, dass Produkt 1 teurer ist. 


Abb. 6.13 Gepaarter t-Test mit Excel 





6.2.2 Wilcoxon-Vorzeichen-Rang-Test 


Der Wilcoxon-Vorzeichen-Rang-Test (engl.: Wilcoxon signed-rank test) ermöglicht die 
Untersuchung zweier gepaarter und mindestens ordinalskalierter Zufallsvariablen auf 
Gleichheit der zentralen Tendenz. Da dieser Test keine Verteilungsannahmen benötigt, 
gilt er als nicht-parametrische Alternative zum gepaarten 7-Test. Er wird primär bei 
Rangdaten genutzt, sollte aber immer auch dann zum Einsatz kommen, wenn die Vor- 
aussetzungen des oben beschriebenen /-Tests für gepaarte Stichproben nicht erfüllt sind. 
Selbst in den Fällen, in denen die Voraussetzungen eines parametrischen Testverfahrens 
erfüllt sind, werden dem Wilcoxon-Vorzeichen-Rang-Test sehr effiziente Testeigenschaf- 
ten zugeschrieben. 

Bei der Konstruktion seines Tests griff Wilcoxon (1945, 1947) letztlich die Grundidee 
von Charles Edward Spearman (1904) auf, der sich bei der Berechnung des nach ıhm 
benannten Rangkorrelationskoeffizienten an die Rechenmethode der Pearson-Korrelation 
anlehnte, aber als Datengrundlage anstelle der metrischen Originaldaten dıe Rangdaten 
verwendete. Wilcoxon ging von der Berechnungsmethode des gepaarten 7-Tests aus, ver- 
wendete aber anstelle der metrischen Ausgangsdaten nun seinerseits die transformierten 
Rangdaten als Datengrundlage. 
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(1) (2) (3) (4) (5) (6) (7) (8) 


Verkaufs- Preis Preis Preisdifferenz (d;) Ränge der "Positive "Negative Null- 
stelle Sortel  Sorte2 (Produkt 1 - Produkt 2) Differenzen Ränge" Ränge" differenz 
1 3.22 3.01 0.21 29 29 
2 3.09 3:16 -0.07 I 13 
3 3.09 2.99 0.10 17.5 17,5 
4 3.40 3.39 0.01 2.8 2.5 
5 8.09 3.23 -0.14 26.5 26.5 
6 3.19 3.05 0.14 26.5 26.5 
7 2.99 2.88 0.11 20 20 
8 2.65 2,97 0.08 15 15 
9 3.09 2.99 0.10 17.5 17.5 
10 3.09 21 -0.12 23 23 
11 3.19 3.05 0.14 26.9 26.5 
12 3:09 3.06 0.03 8 8 
13 2.89 2.81 0.08 15 15 
14 2.99 2.96 0.03 8 8 
15 2.99 2.88 0.11 20 20 
16 2.97 2.94 0.03 8 8 
17 2.97 2.94 0.03 8 8 
18 3.09 3.20 -0.11 20 20 
19 2,59 2 -0.14 26.5 263 
20 2.99 2.87 0.12 23 23 
21 2.89 2,89 0.00 x 
22 3.09 3.19 -0.04 113 115 
23 2,59 2,59 0.00 x 
24 2.89 2.93 -0.04 115 11.5 
25 2.79 2.80 -0.01 2,3 2.5 
26 2.99 2,96 0.03 8 8 
27 2,99 3.07 -0.08 15 15 
28 2.79 2.80 -0.01 2,9 2,5 
29 2.91 2.90 0.01 23 2,5 
30 3.04 3.02 0.02 5 5 
sl 2.69 2.57 0.12 23 23 
2 272 2.50 0.22 30 30 
465 313 152 


Abb. 6.14 Daten für den Wilcoxon-Vorzeichen-Rang-Test 


Wir wollen uns die Vorgehensweise wieder anhand des oben bereits kennengelernten 
Datensatzes der Kaffeesorten aufzeigen und überprüfen, ob sıch die Preise der beiden Kaf- 
feesorten in ihrer zentralen Tendenz (M )- also im Mittel - unterscheiden (vgl. Abb. 6.14). 


1. Schritt: Formulierung der Hypothesen 
Es handelt sich bei der vorliegenden Fragestellung um einen zweiseitigen Hypothesentest. 
Die Hypothesen lauten in diesem Fall: 


An: Mı -M; = 
H\: M\-M, £0 
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Würde die Fragestellung lauten, ob Produkt I ım Durchschnitt signifikant teurer ist, hätte 
der einseitige Hypothesentest wıe folgt formuliert werden müssen: 


Ho: kı < Ua: Produktpreis 1 ist kleiner oder gleich dem Produktpreis 2 versus 
Hj: uı > U>: Produktpreis 1 ist größer als der Produktpreis 2 


Der zu beweisende Tatbestand würde somit wiederum in der 77, -Hypothese festgelegt. 


2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für «& ist. Der «-Fehler wird auf « = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 
Es wurde eine Zufallsstichprobe im Umfang von n = 32 gezogen. 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder ordinales Skalenniveau für beide v 
Variablen 

Es liegt eine Zufallsstichprobe vor v 
Beide Variablen sollten annähernd die gleiche Form der ‘ 


Verteilung besitzen 


5. Schritt: Bestimmung des kritischen Testwerts 
Rechentechnisch wird für jeden Testmarkt zunächst die Preisdifferenz (Preis 1-Preis 2) ge- 
bildet (vgl. Spalte (4) in Abb. 6.14). Alle Beobachtungen, bei denen keine Preisdifferenzen 
bestehen, werden im weiteren Verlauf der Berechnungen nicht mehr berücksichtigt. Die 
neue Stichprobengröße beträgt dann n* = 30.° 

Ungeachtet des Vorzeichens werden die Differenzen ihrer Größe nach geordnet in eine 
Rangreihe gebracht (vgl. Spalte (5) in Abb. 6.14). Je größer die absolute Preisdifferenz ist, 
umso höher ist der Rangplatz. Für gleich große Preisdifferenzen - also bei Vorliegen von 
Rangbindungen - werden die durchschnittlichen Ränge berechnet. Danach werden alle 20 
„positiven Rangplätze“, also alle Rangzahlen, die im ursprünglichen Datensatz mit einer 
positiven Preisdifferenz verbunden sind, aufaddiert (vgl. Spalte (6) ın Abb. 6.14). 


n 
W' = Y_ positive Rangdaten = 313. (6.26) 
i=1 


® Dieser Schritt wird in Statistikpaketen i.d.R. automatisch vollzogen. 
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Gleiches erfolgt für die zehn ‚negativen Rangplätze“ (vgl. Spalte (7) in Abb. 6.14): 


n 


W= Y_ negative Rangdaten = 152. (6.27) 
i=1 


Es ist nun auffällig, dass die Summe der positiven Ränge sehr viel größer als die Sum- 
me der negativen Ränge ist. Offenbar ist Produkt 1 häufiger teurer als Produkt 2, denn 
bei Preisgleichheit müsste tendenziell eine Hälfte der gesamten Rangsumme auf positive 
und die andere Hälfte auf negative Differenzen fallen. In beiden Fällen würden wir eine 
Rangsumme von 232,5 erwarten: 


n*-(n*+1) _ 30:30 +1) 


E(W*+)=E(W) = ; ; 


=) (6.28) 
Dies ist nun aber nicht der Fall: Je mehr sich W* und W” voneinander unterscheiden, 
umso wahrscheinlicher ist ein Unterschied zwischen beiden Rangreihen. Oder anders aus- 
gedrückt: Je mehr sich W * und W” voneinander unterscheiden, umso unwahrscheinlicher 
ist die Beibehaltung von Ao, dass die beiden ordinalen Messreihen keinen Unterschied 
hinsichtlich ihrer zentralen Tendenz aufweisen. Ist dieser Zusammenhang nun aber statis- 
tisch signifikant? 

Um diese Frage beantworten zu können, wird in der weiteren Vorgehensweise zwi- 
schen kleinen und großen Stichproben unterschieden. Für kleine Stichproben mit bis zu 
25 Beobachtungen (n* < 25) liegen die in Abschn. 8.4 wiedergegebenen kritischen Werte 
in Form einer Tabelle vor. Für unser Beispiel ergibt sich bei einer zweiseitigen Hypothese 
und einem festgelegten « von 0,05 ein kritischer Testwert von W. = 137. 


6. Schritt: Bestimmung des empirischen Testwerts 
Dieser Wert ist mit dem empirischen Testwert W zu vergleichen. Hierzu ist das Minimum 
aus den beiden Rangsummen W* und W” zu bestimmen: 


W = min (W*;W”) = min(313; 152) = 152. (6.29) 


7. Schritt: Testentscheidung 
Ist dieses Minimum W größer als der kritische Wert, wird Ag nicht abgelehnt, ansonsten 
verworfen. Im Vergleich zu den anderen Testverfahren ist die Testlogik hier also genau 
entgegengesetzt, nämlich A, wird verworfen, wenn der empirische Testwert W kleiner 
als der kritische Tabellenwert ıst. Die Logik dahinter besteht darin, dass das Minimum 
aus W* und W” umso kleiner ist, je größer der Preisunterschied ist. 

In unserem Beispiel ist W mit einem Wert von 152 größer als der kritische Tabellenwert 
W. = 137, sodass An nicht verworfen wird und der Preisunterschied bei einem «& von 0,05 
als statistisch nicht signifikant angenommen wird. 


W = min (W*;W”) = min(313; 152) = 152 > 137 = W.(0.05;n* = 30). (6.30) 
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Das soeben beschriebene Verfahren beschreibt den exakten Wilcoxon-Vorzeichen-Rang- 
Test. Er basiert auf den in Abschn. 8.4 bis zu einer Stichprobengröße von 50 darge- 
stellten Tabellenwerten für W.. In Fällen größerer Stichproben kommt der asymptoti- 
sche Wilcoxon-Vorzeichen-Rang-Test zur Anwendung. Bei Stichproben größer als 25 
(n* > 25) und keinen Rangbindungen ist die folgende Größe Z asymptotisch standard- 
normalverteilt. Diese wirkt auf den ersten Blick kompliziert, beinhaltet aber lediglich die 
Parameter W und n*: 
Ww_ (u) 


n*-(n*+1)-2-n*+]) 
V 24 


Liegen Rangbindungen vor, erfolgt die Berechnung durch folgende — etwas komplexere — 


Z =  N(0:1). (6.31) 


Formel, bei der k der Anzahl der Rangbindungen und 7; der Länge der i-ten Rangbindung 


n”-(n*+]1) 
WE) 


entspricht: 


 N(0: 1). (6.32) 
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In unserem Beispiel liegen eine Rangbindung der Länge 2 (Rang: 17,5), 5 Rangbindungen 
der Länge 3 (Rang: 2,5; 5; 8; 15; 20) und 2 der Länge vier (Rang: 23; 26) vor. Es ergibt sich 
ein empirischer Z-Wert von: 


— (-1,658). (6.33) 





Die Formel soll an dieser Stelle nicht erschrecken, denn in der Praxis wird die Berechnung 
des z-Wertes dem Computer überlassen, der 1.d.R. auch den dazugehörigen p-Wert mit 
ausweist. Hierzu erfahren wir ın den nächsten Abschnitten mehr. 

Sollte ausnahmsweise dennoch der Test von Hand berechnet werden, ist zu überprüfen, 
ob der empirisch ermittelte Z-Wert in den Ao-Ablehnungsbereich der Normalverteilung 
fällt oder nicht (vgl. Abb. 6.15). Für eine zweiseitige Fragestellung und ein festgelegtes «& 
von 0,05 ergeben sich aus der Normalverteilungstabelle für den Bereich der Beibehaltung 
von A, die Grenzen 


Zı_«.« = (+1,96). (6.34) 


x.a 
2.”2 


Der empirische z-Wert liegt mit 1,658 ın diesem Bereich, sodass Ag, nicht verworfen 
werden kann. 


6.2.2.1 Berechnung des Wilcoxon-Vorzeichen-Rang-Tests mit SPSS 
Anhand der Beispieldatei Kaffee.sav wollen wir den Wilcoxon-Vorzeichen-Rang-Test 
durch die Befehlsfolge Analyze — Nonparametric Tests — Legacy Dialogs — 2 Related 
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1-0=95% 





0 /2=0,025 0/2=0,025 







Ablehnung |+— Keine Ablehnung von H, —| Ablehnung 


von H, von H, 
Kritische Kritische 
Untergrenze Obergrenze 
-1,96 1,96 


Abb. 6.15 Ablehnungsbereich beim Wilcoxon-Vorzeichen-Rang-Test 


Samples ....” in SPSS berechnen. Es öffnet sich die Dialogbox aus Abb. 6.16, in der die 
beiden zu vergleichenden Variablen Preis_l und Preis_2 per „drag and drop“ in das Feld 
für Variablel und Variable2 gezogen werden. Durch die Auswahl der Schaltfläche Ex- 
act... kann ein exakter oder asymptotischer Wilcoxon-Vorzeichen-Rang-Test angefordert 
werden. Ein exakter Test sollte insbesondere bei kleinen Stichproben verwendet werden. 
Nach Bestätigung durch OK ergeben sich die Tabellen in Abb. 6.16. Die linke Tabelle 
weist neben den Rangsummen W* und W” auch die absoluten Häufigkeiten positiver 
und negativer Ränge sowie die Anzahl preisgleicher Beobachtungen aus. In der rechten 
Tabelle sind die p-Werte für einseitige und zweiseitige Hypothesentests wiedergegeben. 
Man irrt in 9,9% der Fälle, wenn man von einem (Preis-)Unterschied ausgeht. Dieser 
Wert liegt über dem festgelegten Wert für « = 5%. Der Unterschied ist somit nicht 
signifikant. 

Bei einem einseitigen Hypothesentest würde man sich in 4,9% der Fälle irren, wenn 
man davon ausgeht, dass Produkt 2 in der zentralen Tendenz billiger ist. Dieses Ergebnis 
wäre statistisch signifikant." 


6.2.2.2 Berechnung des Wilcoxon-Vorzeichen-Rang-Tests mit Stata 
Anhand der Beispieldatei Kaffee.dta wollen wir den Wilcoxon-Vorzeichen-Rang-Test 
durch die Befehlsfolge Statistics > Summaries, tables, and tests > Nonparametric tests 


° In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Nicht parametrische 
Tests > Alte Dialogfelder > Zwei verbundene Stichproben ... 

10 Eine sehr gute Darstellung über die Vorgehensweise in SPSS findet sich hier: https://www. 
youtube.com/watch?v=dkobjvhxTro. 


6 Testverfahren 


170 


‘Yyadsne paTyDsIsyunstsIg WOUII 


UOA UEUI UUSM /Offeg IP % 6/6 UI LIT ve :Mam-d 





IST JS3IMg zZ PINPo1Iq ssep ya3sne uoAep 
uUeUuI UUOM ‘olfed ISp % 67 Ur LI ve Mom -d 





‘Syueı aaıpısod uo pasegq ‘q 
Isa], SJuey paudig uoxoopM 'e 
| ANTrgOLd Mutog 

(papeı-T) Sig pexq 

(papeı-z) Sig pexq 
(payey-z) Sig "dunksy 
z 











[ 2Uossayjey sel] 


- 7 allosaajjey SIold 


‚ysyeIg 159 L 


'S}S3], USYISTOYdUuLAse saurd 
I9PO S}S3], USPJEX9 saUTa SunIynyyding 





Sasels 5 ayı Bunndıuoa u pajem 
JG papuno, SÄEme Aue Sjunos a3 "Spore syoydulseugu co 
"AOge Sjuum euogeyndus 
yayım Oper) Sjuoy jo peajsu pasn ag am poypau jsex 





SSAS HU ISAL-FUEA-USYITPZIOA-UOXOIILM 9L’9 'qAY 


usurunsguey 
(.M) aaısod 


y2IOJSSTOId TeW 7 
] 34OS se 191N3} 7 34105 [eW OL 


1 33105 se J9317]Lq 7 3105 JEW 07 


pun (.M) 2aye3aN 





L Ppossayey Stalg = Z aossaygeg Sal ‘> 
I aposaayjey star] < 7 auosaayyey star 'q 
[ PROSSSJJey SIalg > Z Oyosaajjpeg sau] 'e 
Io 
sol] 
0z'S1 SQUrY BAHISO]  — [ Spossapeyy stald 
SY’GT 07 Syuey argedany  - Taylosaayjey sıaıg 


syury] 





6.2 Tests für zwei abhängige Stichproben 171 


—— _ 


(Feigmrank - Wilconon matched-pairs signec-ankstest | © | 


Man burn ——n Einfügen der beiden zu vergleichenden Test-Variablen. 
Express 


Yanabla 


Tale Some - Br Dr 20 Mal Sorte 2 billiger als Sorte 1 
10 Mal Sorte 2 teurer als Sorte 1 
2 Mal preisgleich 


. signrank Preis Sorte 1 = Preis Sorte 2 
Wwilcoxon signed-rank test 





| obs sum ranks expected 

messe +--------------- -—- - ------ - - -- ----—- 
| 20 38 262»5 
| 170 262.5 
| 








a Be | a] Cancel Subrmii 


Negative (W’) und positive (W*) Rangsummen 


Nulldifferenzen werden bei Stata mit einbezogen, 











for ties 
for zeros -1,.25 








allerdings weiter unten wird um diesen Effekt 
korrigiert. 








g : - adjusted variance 2854.38 
Korrektur für Rangbindungen und Nulldifferenzen. / Ho: Preis Sorte 1 = Preis Sorte 2 
zZ 12231 
p-Wert: Man irrt in 8,3 % der Fälle, wenn man von Prob > |z| 
einem Preisunterschied ausgeht. | 


0.0834 
Abb. 6.17 Wilcoxon-Vorzeichen-Rang-Test mit Stata 





of hypotheses — Wilcoxon paired-matched signed rank test in Stata berechnen. Es Öffnet 
sich die Dialogbox aus Abb. 6.17, in der die beiden zu vergleichenden Variablen Preis_1 
und Preis_2 in die entsprechenden Felder eingetragen werden. Nach Bestätigung durch 
OK ergeben sich die Tabellen in Abb. 6.17. Die Tabelle weist neben den Rangsummen 
W* und W” auch die absoluten Häufigkeiten positiver und negativer Ränge sowie die 
Anzahl (preis-)gleicher Beobachtungen aus. Unten ist der p-Wert für den zweiseitigen 
Hypothesentest wiedergegeben. Man irrt in 8,3 % der Fälle, wenn man von einem (Preis-) 
Unterschied ausgeht.!! 


6.2.2.3 Berechnung des Wilcoxon-Vorzeichen-Rang-Test mit Excel 

Der Wilcoxon-Vorzeichen-Rang-Test ist nicht als gesonderte Funktion in Excel imple- 
mentiert. Auf Basis unserer Beispieldatei Kaffee.xIs wird ın Abb. 6.18 aber gezeigt, wie 
der asymptotische p-Wert berechnet werden kann. Zu beachten ist dabei, dass bei kleine- 
ren Stichproben (n < 25) mit Hilfe der Wilcoxon-Tabelle (vgl. Abschn. 8.4) gearbeitet 
werden sollte. Auch wird bei dieser Vorgehensweise nicht um den Effekt von möglichen 


Rangbindungen korrigiert.'? 


I! Sehr gute Darstellungen über die Vorgehensweise in Stata findet sich hier: https://www.youtube. 
com/watch”?v=20JxerMCwIlE und hier: https://www.youtube.com/watch?v=NIwtaZqNFs8. 

12 Sehr gute Darstellungen über die Vorgehensweise in Excel findet sich hier: https://www.youtube. 
com/watch?’v=xlgeta9Fivl und hier: https://www.youtube.com/watch?v=mJtbhGETUS8. 
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Abb. 6.18 Wilcoxon-Vorzeichen-Rang-Test mit Excel 


6.3 Tests für zwei unabhängige Stichproben 
6.3.1 t-Test zweier unabhängiger Stichproben 


Der 1-Test zweier unabhängiger Stichproben beantwortet die Frage, ob sıch der Mittelwert 
zweier Gruppen unterscheidet. Die Stichprobe lässt sich also mit Hilfe einer Gruppie- 
rungsvariablen in zwei getrennte Stichproben zerlegen. Für die beiden Gruppen besteht 
für die Grundgesamtheit die Annahme, dass sich deren Erwartungswerte hinsichtlich ei- 
ner metrischen Variablen im Umfang von A unterscheiden: 


1. Schritt: Formulierung der Hypothesen 
Ho: yı = Wa = A. 


Die am häufigsten getroffene Annahme für den Unterschied ist dabei A = 0, also dass 
kein Unterschied zwischen uı und > besteht. Die entsprechenden Hypothesen eines 
zweiseitigen Tests lauten dann: 


Ho: pı = ua und Hi: ı # Ma 
2. Schritt: Festlegung des Signifikanzniveaus «& 


Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ag irrtümlicherweise abgelehnt wird, obwohl die 
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Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 

In der Grundgesamtheit liegt für die Population 1 ein ws, bei einer Streuung von 07 VOTr. 
Gleiches gilt für die Population 2 mit u» und ©). Nun wird aus der Population 1 eine 
Stichprobe der Größe n und aus der Population 2 eine Stichprobe der Größe n, gezogen. 
Für beide Stichproben bestimmen wir die Mittelwerte (x und x») und die theoretischen 
Standardabweichungen (0; und 02). 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder annähernd metrisches Skalenniveau der \ 


Testvariablen 
Es liegt eine Zufallsstichprobe vor V 
Die beiden Stichproben sind unabhängig voneinander V 


Testvariable ist in der Grundgesamtheit annähernd normal- | vV/ 
verteilt oder die Stichprobe ist groß genug (n > 30) 


5. Schritt: Bestimmung des kritischen Testwerts 

Wie beim Einstichproben-1-Test folgt auch die Differenz der Mittelwerte der beiden Stich- 
proben einer t-Verteilung mit (n; + na — 2) Freiheitsgraden. Der kritische f-Wert eines 
zweiseitigen Tests ist dabei wie folgt definiert: 


kritisch 
en +ng-2° (0:59) 
Für den einseitigen Test gilt: 
kritisch 
a user (6.36) 


6. Schritt: Bestimmung des empirischen Testwerts 
Aus den Stichproben lassen sich nun die Werte für X}, X», nı, n», 6 berechnen und der 
empirische f-Wert bestimmen. 


_ en (6.37) 


Um den Wert genau berechnen zu können, müssen wir vorab die Annahme überprüfen, 
ob die Varianzen der beiden Stichproben gleich oder ungleich sind. Im ersten Fall spricht 
man von homoskedastischen, im zweiten Fall von heteroskedastischen Varianzen. Wenn 
die Varianzen homoskedastisch sind, gilt in der Grundgesamtheit o;, = % und damit für 
die Stichprobe: 

m=D-7+5= 1-0 


6.38 
nı +n, —2 ( 


0=01=%= 


174 6 Testverfahren 
Oben stehender t-Wert kann dann wie folgt umgeformt werden: 


yrıtn2=2 — 





I (6.39) 
(4 + 4) , M=Di+m-N:ö 


nı n2 nı+n—2 


7. Schritt: Testentscheidung 
Liegt der der Betrag des empirischen Testwertes über dem kritischen Testwert, ist Ao zu 
verwerfen, ansonsten nicht. 


Ri] 


(+) 


nı n3 nı+na—2 


kritisch A nz 
en 4na-2 = 1 — 


— Ablehnung Ho. (6.40) 






Danach kann überprüft werden, wie wahrscheinlich dieser t-Wert bei (n; + na — 2) Frei- 
heitsgraden unter der Annahme der Gültigkeit der Nullhypothese ist. Liegt der p-Wert 
unter dem festgelegten Signifikanzniveau &, wird Flo verworfen (vgl. die Berechnungen 
mit dem Computer in den folgenden Abschnitten). 

Ob die Annahme gleicher Varianzen glaubhaft unterstellt werden kann, überprüft der 
F-Test oder der Levene-Test. Auf beide Tests gehen wir im Rahmen der Softwareanwen- 
dungen später nochmals genauer ein. Kann die Varianzgleichheit nicht unterstellt werden, 
kommen abgewandelte Berechnungen des 1-Werts zum Einsatz. Zwei Vorschläge zur Be- 
stimmung des kritischen t-Wertes im heteroskedastischen Fall o;ı # o> kommen von 
Welch (1947) und Satterthwaite (1946). In vielen Fällen gestaltet sich die Berechnung der 
Teststatistik komplex, sodass wir diese Aufgabe später dem Computer überlassen werden. 

Der t-Test verhält sich allerdings sehr robust gegenüber Verletzungen seiner Anwen- 
dungsvoraussetzungen, wenn die Stichproben annähernd gleich groß sind. Dies gilt ins- 
besondere für eingipflige Verteilungen. Sind die Stichprobengrößen hingegen deutlich 
unterschiedlich, ist die Präzision des f-Tests solange kaum beeinträchtigt, wie die Vari- 
anzen annähernd gleich groß sind. Sind Stichprobengröße als auch Varianzen der bei- 
den Teilgesamtheiten nicht annähernd identisch, muss davon ausgegangen werden, dass 
die Testergebnisse verzerrt sind. In diesem Fall sollte der nicht-parametrische U-Test 
(vgl.Abschn. 6.3.2) verwendet werden. 

Die Vorgehensweise zur Berechnung eines t-Tests für zwei unabhängige Stichpro- 
ben mit Excel, SPSS oder Stata soll anhand des folgenden Beispiels gezeigt werden: 
Ein Unternehmen möchte eine neue Pralinensorte auf den Markt bringen. Die Unterneh- 
mensführung ist sich allerdings noch über die Verpackungsfarbe uneinig. Zur Diskussion 
stehen blaue oder gelbe Verpackungen. Im Rahmen einer Marktforschungsstudie in 240 
gleichwertigen Testmärkten soll die Wirkung der Farbe auf den Absatz untersucht werden. 
Unterscheiden sich die Absätze für die beiden Verpackungsfarben auf dem 5 %-Niveau 
signifikant voneinander? 
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6.3.1.1 1-Test zweier unabhängiger Stichproben mit SPSS 

Anhand der Beispieldatei schokopraline_farbe_name_preis.sav wollen wir den 7-Test für 
zwei unabhängige Stichproben durch die Befehlsfolge Analyze > Compare Means — 
Independent-Samples T Test ....'” berechnen. Es öffnet sich die Dialogbox aus Abb. 6.19, 
in der die abhängige Variable (absatz) und der nominale Faktor (farbe) eingegeben wer- 
den. Unter Define Groups sind die beiden zu vergleichenden Gruppennummern festzule- 
gen. In unserem Fall sind das die 1 für die blaue und die 2 für die gelbe Verpackungsfarbe. 
Nach Bestätigung durch OK ergeben sich die Tabellen in Abb. 6.19. 

Die beiden Mittelwerte Xylau = 9982,37 für die blaue Verpackung und Xgeı = 9606,10 
für die gelbe Verpackung deuten auf einen Unterschied in den Verkaufszahlen, je nach 
Verpackungsfarbe. Zunächst muss überprüft werden, ob die Voraussetzung der Varianz- 
gleichheit erfüllt ıst. Der Levene-Test weist einen p-Wert von p = 0.000 aus, sodass der 
p-Wert kleiner als p = 5% ist, wenn man von der Annahme der Varianzungleichheit 
ausgeht. SPSS weist in der zweiten Zeile für den heteroskedastischen Fall (Equal Varian- 
ces not assumed) die Ergebnisse des t-Tests mit Welch-Approximation aus. Dem dort in 
der Spalte Sig. (2-tailed) angegebenen p-Wert von p = 0.000 ist zu entnehmen, dass 
sich auch die Mittelwerte der Absätze der beiden Verpackungsfarben signifikant vonein- 
ander unterscheiden. Die Absatzdifferenz zwischen gelber und blauer Verpackung liegt 
mit 95 %-iger Sicherheit zwischen den Werten 264,146 und 488,454. 

Zwar ergeben sıch für die beiden Verpackungsfarben signifikante Abweichungen von 
der Normalverteilung,'* allerdings stellt die Stichprobe mit 240 Beobachtungen nicht nur 
eine sehr große Stichprobengröße dar, sondern die beiden Einzelstichproben sind zudem 
gleich groß und annähernd eingipflig, weshalb kaum mit einer Verzerrung der Ergebnisse 
zu rechnen ist. 


6.3.1.2 t-Test zweier unabhängiger Stichproben mit Stata 

Mit Hilfe der Daten in der Datei schokopraline_farbe_name_preis.dta wollen wir den 
t-Test mit zwei unabhängigen Stichproben mit Stata berechnen. Zunächst müssen die 
Anwendungsvoraussetzungen des 7-Tests überprüft werden. Mit Hilfe der Befehlsfolge 
Statistics > Summaries, tables, and tests — Classical tests of hypotheses — Robust 
equal-variance test erfolgt die Überprüfung der Annahme der Varianzgleichheit durch 
den Levene-Test. Unter Variable: ist die Variable absatz und unter Variable defining com- 
parison groups: die Gruppierungsvariable farbe einzutragen. Nach Bestätigung durch OK 
werden drei verschiedene Statistiken zur Überprüfung von Varianzgleichheit ausgegeben, 
nämlich die Levene-Statistik (WO) sowie zwei Varianten der Brown und Forsythe’s F- 


13 In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren — Mittelwerte verglei- 
chen > t-Test bei unabhängigen Stichproben ... 

14 Die Ergebnisse des Kolmogorov-Smirnov-Tests und des Shapiro-Wilk Tests (vgl. Abschn. 6.5.2) 
führen zum Verwerfen der Hypothese einer Normalverteilung. 
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Statistik (W5SO und W10): 
WO = 13.666002 df(1,238) Pr > F = 0.00027109 
W50 = 9.140792  df(1, 238) Pr > F = 0.00277339 
W10 = 13.408026 df(1,238) Pr = F= 0.000308. 


Alle p-Werte - in diesem Fall als Pr > F ausgewiesen — liegen unter der üblichen 
Schwelle des Signifikanzniveaus von «@ = 5%, weshalb nicht von einer Varianzgleichheit 
ausgegangen werden kann. Zwar ergeben sich für beide Verpackungsfarben signifikante 
Abweichungen von der Normalverteilung,'” allerdings stellt die Stichprobe mit 240 Beob- 
achtungen nicht nur eine sehr große Stichprobengröße dar, sondern die Einzelstichproben 
sind zudem beide gleich groß und annähernd eingipflig, weshalb kaum mit einer Verzer- 
rung der Ergebnisse zu rechnen ist. 

Die Berechnung des 1-Tests für zwei unabhängige Stichproben erfolgt dann durch die 
Befehlsfolge Statistics > Summaries, tables, and tests — Classical tests of hypotheses 
— Two-group mean-comparison test. Es öffnet sich die Dialogbox aus Abb. 6.20, ın der 
die abhängige Variable (absatz) und die binomiale Gruppierungsvariable (farbe) festge- 
legt werden. Liegt Varianzungleichheit vor, so ist Unequal Variances zu wählen. In diesem 
Fall wird der 7-Test nach Satterthwaite (1946) berechnet. Wird zudem Welch’s approxi- 
mation gewählt, erfolgt die Berechnung des 7-Tests auf Basis von Welch (1947). Beide 
unterscheiden sich ın der Approximierung ihrer Freiheitsgrade. 

Für die beiden Mittelwerte ergeben sich Xpıau = 9982,37 für die blaue Verpackung und 
X geıb = 9606,10 für die gelbe Verpackung. Der Unterschied zwischen diesen beiden Wer- 
ten ist statistisch signifikant, da der p-Wert mit Pr(|T| > |t|) = 0.0000 unter der üblichen 
Schwelle des Signifikanzniveaus von«a = 5% liegt. Die Absatzdifferenz zwischen gelber 
und blauer Verpackung liegt mit 95 %-iger Sicherheit zwischen den Werten 264,146 und 
488,454. 


6.3.1.3 t-Test zweier unabhängiger Stichproben mit Excel 
Um die Testprozedur mit Excel sinnvoll durchführen zu können, müssen die Daten hin- 
sichtlich ihrer Gruppierungsvariablen in zusammenhängenden Datenblöcken angeordnet 
werden. Dies geschieht am einfachsten, indem der gesamte Datensatz (Chocoprali- 
ne_colour_name_price.xis) markiert und danach durch die Befehlsfolge Daten — 
Sortieren nach der Gruppierungsvariablen auf- oder absteigend sortiert wird. Durch 
diese Sortierung werden die zu vergleichenden Gruppen ım Datensatz nacheinander 
angeordnet. 

Sind in Excel mit dem Add-Ins-Manager die Module Analyse-Funktionen und Analyse- 
Funktionen-VBA dauerhaft aktiviert,'° kann im Menüpunkt Daten die Schaltfläche Da- 


15 Die Ergebnisse des Kolmogorov-Smirnov-Tests und des Shapiro-Wilk Tests (vgl. Abschn. 6.5.2) 
führen zum Verwerfen der Hypothese einer Normalverteilung. 

16 Für Excel 2010 ist dieser über die Schaltflächenkombination Datei > Optionen — Add-ins — 
Gehe zu erreichbar. 
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| test - Two-group mean-comparison test 








Algen bydılın 

a Eee ee _— Einfügen der gewünschten Gruppenvariablen (farbe). 
Baar u Aattriı ” 

zZ =” Conidencoe level 


| re 


Nee eumnaben 





Ka Wh Ei "7" Ber 







. ttest absatz, by(farbe) unegZual 


Standardfehler bei Farbe blau. 





Variable Obs .d k a . Interval] 


blau 120 9982.367 32.19893 385.1468 9912.748 10051.98 
gelb 120 9606.067 44.175685 490.2867 9517.444 9694.69 


Die Absatzdifferenz zwischen gelber und blauer 








combined 240 9794.217 30.89599 478.6386 . i a i , 
Verpackung liegt mit 95%-iger Sicherheit 
------ --- +4----------- ---- ---- - --- -------- ---------- ---- --------------5.7----- Ä 
zwischen 264,146 und 488,454. 
diff 376.3 56.91507 
diff = mean (blau) - mean(gelb) t = 6.6116 
Ho: diff = Satterthwaite's degrees of freedom = 225.364 
Ha: diff <O Ha: diff != 0 Ha: diff > 0 
Pr(T < t) = 1.0000 Pr(IT| > |t|) = 0.0000 Pr(T > t) = 0.0000 


Zn Die Mittelwerte der beiden Gruppen unterscheiden sich signifikant voneinander (p<0.05). 





Abb. 6.20 :-Test für zwei unabhängige Stichproben mit Stata 


tenanalyse gewählt und die Funktion Zweistichproben F-Test ausgewählt werden, um die 
Annahme der Varianzgleichheit zu überprüfen.!’ Im geöffneten Fenster wird unter Bereich 
Variable A: der Bereich der Testvariablen der ersten Gruppe und unter Bereich Variable 
B: der Bereich der Testvariablen der zweiten Gruppe eingetragen. Dabei ist unbedingt zu 
beachten, dass Excel nur dann korrekte Werte ausweist, wenn die Variable mit der grö- 
ßeren Varianz unter Bereich Variable A: und die Variable mit der kleineren Varianz unter 
Bereich Variable B: eingetragen wird! Unter Alpha ist das gewünschte Signifikanzniveau 
(1.d.R. liegt das bei x = 0,05) anzugeben. Den Ergebnissen aus Abb. 6.21 ist zu ent- 
nehmen, dass die Prüfgröße F größer als der — auf Basis von & berechnete - kritische 
F-Wert ist, sodass die Annahme der Varianzgleichheit (7/9) verworfen wird. Der p-Wert 
liegt mit p = 0,004 unter der üblichen Schwelle von « = 5%, weshalb nicht von einer 
Varianzgleichheit ausgegangen werden kann. 


”Sehr gute Darstellungen über die Vorgehensweise bei Excel finden sich hier: https:// 
www.youtube.com/watch?v=qI_RmXUItOY und hier:  https://www.youtube.com/watch”?v= 
2lAPRrnUBRK. 
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Die Berechnung des 1-Tests für zwei unabhängige Stichproben mit nichtgleichen Va- 
rıianzen erfolgt dann durch die Befehlsfolge Daten > Datenanalyse — Zweistichproben 
T-Test: Unterschiedlicher Varianzen. Im Fall gleicher Varıianzen wäre Zweistichproben T- 
Test: Gleicher Varianzen zu wählen gewesen.'® 

In der geöffneten Dialogbox (vgl. Abb. 6.22) wird wiederum unter Bereich Variable 
A: der Bereich der Testvariablen der ersten Gruppe und unter Bereich Variable B: der 
Bereich der Testvariablen der zweiten Gruppe eingetragen. In der Kategorie Aypothetische 
Differenz der Mittelwerte wird nichts eingetragen. 

Für die beiden Mittelwerte ergeben sich Xplau = 9982,37 für die blaue Verpackung 
und Xgeım = 9606,07 für die gelbe Verpackung. Der Unterschied zwischen diesen beiden 
Werten ist statistisch signifikant, da der p-Wert mit P(T < r) zweiseitig = 0.0000 unter 
der üblichen Schwelle für das Signifikanzniveau von @ = 5 % liegt. 


6.3.2 Mann-Whitney-U-Test (Wilcoxon Rank-Sum Test) 


Einen nicht-parametrischen Test zur Überprüfung von Unterschieden zweier unabhängi- 
ger Stichproben (oder Gruppen) hinsichtlich ihrer zentralen Tendenz einer ordinalen oder 
metrischen Variablen stellt der sogenannte U-Test von Mann-Whitney (1947) dar. Dieser 
Test, der häufig auch als Wilcoxon-Rangsummen-Test (engl.: Wilcoxon rank-sum test) 
bezeichnet wird (Wilcoxon 1945), besitzt keine strengen Anwendungsvoraussetzungen: 
Beide Vergleichsgruppen sollten hinsichtlich der zu betrachtenden Testvariablen lediglich 
eine ähnliche Verteilungsform aufweisen. Der U-Test sollte somit dann angewendet wer- 
den, wenn der t-Test für zwei unabhängige Stichproben (vgl. Abschn. 6.3.1) aufgrund 
von Voraussetzungsverletzungen (n < 30 und Grundgesamtheit nicht normalverteilt) der 
zu untersuchenden stetigen Testvariablen nicht verwendet werden kann. Des Weiteren eig- 
net sich der Mann-Whitney-U-Test zum Vergleich zweier Gruppen für eine ordinale - also 
nicht metrische — Testvariable. 

Um die Funktionsweise des Mann-Whitney-U-Tests zu verdeutlichen, betrachten wir 
die Zahlungsbereitschaft von 12 Männern und 13 Frauen für eine bestimmte Weinsorte 
in Abb. 6.23. Die Zahlungsbereitschaft ist ordinal-skaliert auf einer fünfstufigen Skala 
(1=0-5€;2=5,01-10€;3 = 10,01-15€;4 = 15,01 -20 €; 5 = 20,01 -25€). 


1. Schritt: Formulierung der Hypothesen 

Die Frage ist, ob sich Männer und Frauen hinsichtlich ıhrer Zahlungsbereitschaft unter- 
scheiden. Geprüft wird die Nullhypothese, dass sich die durchschnittlichen Ränge der 
beiden Gruppen (männlich/weiblich) nicht unterscheiden gegen die Alternativhypothese, 
dass sie sich unterscheiden: 


18 Sehr gute Darstellungen über die Vorgehensweise bei Excel finden sich hier: https:// 
www.youtube.com/watch?v=BIS11D2VL_U und hier: https://www.youtube.com/watch”?v= 
X14z9r8FUKY. 
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Zahlungs- Rang Zahlungs- 


weiblich 20 
weiblich | Schritt: | 6 | Schritt2: 

weiblich Vergabe 6 Nach Gruppen 

weiblich an: N ordnen 


]10-15 


— 





| weiblich 
eich : 
eich _ : 
eibich 
©] weiblich | 
10-151€ 
10-51 
MEET 
za Schritt 3: 
10-15] € Berechnung 
10-5] € 
MEET 
MEET 
15201€ Mican  Sumol 
Re Geschlecht N 
]15-20] € Klasse der maennlich 12 17.58 211 
]15-20] € Zahlungsbereitschaft _‚eiblich 13 8.77 114 
15201€ 
115-20] € Klasse der Zahlungsbereitschaft 
15201 € | ee 
BER Mann-Whitney U 23.000 
Bo2S1€ 
Wilcoxon W 114.000 
2 -3.126 
Asymp. Sig. (2-tailed) .002 
Exact Sig. [2*(1-tailed Sig.)] .002b 


a Grouping Variable: Geschlecht 
b Not corrected for ties. 


Abb. 6.23 Mann-Whitney-U-Test 


Ho: E(Rı) = E(Ro) 
H}: E(Rı) # E(R;) 


2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 
In unserem Beispiel wird eine Stichprobe ım Umfang von n = 25 gezogen. Die beiden 
Teilstichproben umfassen dabei n; = 12 männliche und nz = 13 Umfrageteilnehmer. 
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4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder ordinales Skalenniveau der Testvariable 
Es liegt eine Zufallsstichprobe vor 
Die beiden Stichproben sind unabhängig voneinander 


2 81% 


Testvariable sollte in den Gruppen annähernd die gleiche 
Verteilungsform aufweisen 


5. Schritt: Bestimmung des empirischen Testwerts 

Um die Hypothesen testen zu können, erfolgt zunächst die Vergabe von Rangplätzen, 
wobei wiederum die Existenz von Rangbindungen beachtet werden muss: Es wurde vier 
Mal die niedrigste Zahlungspräferenz ausgewählt, sodass sich für alle diese Personen eine 


1+2+3+4 


23 6.41 
1 (6.41) 


Rangzahl von 
ergibt (vgl. Schritt 1 in Abb. 6.23). Alle vier (weiblichen) Personen bekommen die Rang- 
zahl 2,5 zugeordnet. Auch die zweitniedrigste Zahlungsbereitschaft wurde von drei Frauen 
gewählt. Auch diese drei Aussagen werden durchschnittliche Ränge mit einem 


5+6+7 


3 zugeordnet. (6.42) 


Rangplatz 6 = 
Die drittgrößte Zahlungsbereitschaft haben vier Männer und vier Frauen ausgewählt. Es 
ergibt sich ein durchschnittlicher 


89,10 EN ER BF 2 D 


8 (6.43) 


Rangplatz von 11,5 = 
der jeweils vier Mal der Gruppe der Männer und der Frauen zugeordnet wird. Glei- 
chermaßen wird mit den restlichen Zahlungsbereitschaften verfahren. Danach werden die 
ermittelten Ränge jeweils geschlechtsspezifisch - also ihrer Gruppenzugehörigkeit nach — 
zugeordnet und der Größe nach geordnet (vgl. Schritt 2 in Abb. 6.23). 

Addiert man danach alle Rangplätze, ergibt sich für die Männer eine Rangsumme von 
211 und für die Frauen eine Rangsumme von 114. Danach wird der durchschnittliche 
Rangplatz berechnet. Damit wird berücksichtigt, dass die Gruppen eine unterschiedliche 
Anzahl an Beobachtungen aufweisen können, was in diesem Beispiel auch tatsächlich der 
Fall ist. Im Durchschnitt belegen die Männer den 17,6-sten (= 221/12) und die Frauen 
den 8,8-ten (= 114/13) Rang. Sollten Männer und Frauen die gleiche Zahlungsbereit- 
schaft aufweisen, so müssten die durchschnittlichen Ränge beider Gruppen annähernd 
gleich groß sein. Augenscheinlich ist dies nicht der Fall, aber auch hier muss überprüft 
werden, ob der Unterschied zwischen den beiden durchschnittlichen Rängen groß genug 
ist, um als statistisch signifikant zu gelten. 

Hierzu wird zunächst eine Prüfgröße U bestimmt — deshalb auch der Name Mann- 
Whitney-U-Test. Hierzu wird berechnet, wie häufig ein Rangplatz in einer Gruppe kleiner 
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ist als die Rangplätze in der anderen Gruppe. Gleich große Rangplätze werden zur Hälfte 
gezählt. 

So wird der erste Wert der männlichen Rangreihe der Größe 11,5 mit allen 13 weibli- 
chen Rangplätzen verglichen: Insgesamt ist dieser Wert 7 Mal größer, 4 Mal gleich groß 
und zwei Mal kleiner als die weiblichen Rangplätze: Insgesamt entsteht ein Teilwert zur 
Berechnung von U in Höhe von 2+4/2 = 4. Entsprechend wird mit allen weiteren Wer- 
ten der männlichen im Vergleich mit den weiblichen Probanden verfahren. Es ergibt sich 
ein Gesamtwert für U von: 


U=4+4+4+4+1+1+1+1+1+1+1+0=23. (6.44) 


InU = 23 von 156 (= nı:na = 12-13) möglichen Vergleichen sind die männlichen Rang- 
plätze kleiner und in U’ = 133 (= 156— 23) Vergleichen sind die männlichen Rangplätze 
größer als die weiblichen. Die Werte für U und U’ lassen sich verkürzt folgendermaßen 
berechnen: 


Männlich: U=nı nm + nel — Rangsummey, 

= 12.134, FI =, (6.45) 
Weiblich: U =n, nm» + — — Rangsumme\y, 

= 12#137 N 2) ge 1>>. (6.46) 


6. Schritt: Bestimmung des kritischen Testwerts 

Würde kein Unterschied zwischen Männern und Frauen bestehen, so würde es bei den 
Vergleichsfällen ebenso viele kleinere wie größere Rangplätze geben und die Werte für U 
und U’ würden (annähernd) übereinstimmen. Es ergibt sich dann ein Erwartungswert für 
U vonE(U) = 156/2 = T8. 

Auf Basis dieser Berechnungen ließe sich nun ein exakter Mann-Whitney-U-Test 
durchführen. In der Praxis berechnen Softwareprogramme diesen exakten Test i.d.R. nur 
in Fällen kleiner Stichproben. Sind die Stichprobenumfänge der beiden Gruppen jeweils 
größer als 20, kann nach Conover (1980) auf die Normalverteilungsapproximation der 
U-Werte um den Erwartungswert E(U) zurückgegriffen wird.'” 


7. Schritt: Testentscheidung 

Bei unserem Beispiel handelt es sich tatsächlich um eine kleine Stichprobe, sodass sowohl 
die Ergebnisse des exakten U-Tests als auch die asymptotische Signifikanz der Approxi- 
mation in Abb. 6.23 angegeben sind. In beiden Fällen irrt man sich in p = 0,2% der Fälle, 


9 Zur genauen Berechnung des approximierten U-Tests wird an dieser Stelle auf Bortz, Lienert, 
Boehnke (2000) verwiesen. 
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wenn man von einer unterschiedlichen Zahlungsbereitschaft bei Männern und Frauen aus- 
geht. Die Nullhypothese einer gleichen Zahlungsbereitschaft bei Männern und Frauen 
kann somit verworfen werden, denn der p-Wert liegt unterhalb der üblicherweise festge- 
legten Grenzen für & (1%, 5% oder 10%). 

Hätten wir an dieser Stelle den t-Test für unabhängige Stichproben verwendet, wäre das 
Ergebnis mit p = 0,01 % annähernd das Gleiche gewesen, obwohl eine Normalverteilung 
nicht angenommen werden kann." Der Grund hierfür liest vor allem in der Tatsache, dass 
der unabhängige 1-Test robust gegenüber dem Fehlen der Voraussetzung der Normalver- 
teilung reagiert. Dies wirft generell die Frage auf, wann der U-Test und wann ein 7-Test 
durchzuführen ist? Bei dieser Entscheidung können folgende Informationen hilfreich sein: 


e Verlaufen die Verteilungen der zu vergleichenden Gruppen ähnlich, drücken die Ergeb- 
nisse des U-Tests vornehmlich Unterschiede ın der zentralen Tendenz der Verteilung 
aus. Je stärker die Verteilungen der beiden Gruppen voneinander abweichen, umso 
mehr werden neben den Unterschieden bei der zentralen Tendenz auch Unterschiede 
ım Verlauf ausgedrückt. 

e Liest eine normalverteilte Population vor, gilt der U-Test als vergleichsweise ineffizi- 
ent. Er ist asymptotisch zu 95 % effizient (Dixon 1954), d.h. anstelle einer Stichprobe 
von 38 für einen unabhängigen t-Test benötigt der U-Test eine Stichprobengröße von 
40. 

e Liegt keine Normalverteilung vor, gilt der U-Test im Vergleich zu einem unrechtmäßig 
eingesetzten 1-Test immer als effizienter (Witting 1960). 


Da die Berechnung beider Testverfahren mit dem Computer heute kein Problem mehr 
darstellt, empfiehlt der Autor im Zweifel die Durchführung beider Testverfahren. Beide 
Verfahren bilden gute „Backups“ für Schlussfolgerungen, wenn die Verfahren zu ähnlı- 
chen Ergebnissen führen. Führen die Tests zu unterschiedlichen Schlussfolgerungen soll- 
ten sich Überlegungen anschließen, warum dies der Fall ist. 


6.3.2.1 Der Mann-Whitney-U-Test mit SPSS 

Anhand der Beispieldatei Rang (Flaschendesign).sav wollen wir in SPSS den U-Test 
durch die Befehlsfolge Analyze > Nonparametric Tests > Legacy Dialogs > 2 Indepen- 
dent Samples ...*' berechnen. Es öffnet sich das in Abb. 6.24 links dargestellte Fenster. 
Die Gruppierungsvariable - in unserem Fall Geschlecht - ıst in das Feld Grouping Varia- 
ble zu verschieben und unter Define Groups sind die zu vergleichenden Gruppennummern 
— in unserem Fall sind das die Gruppen OÖ und 1 - anzugeben. Unter Test Variables List 
erfolgt die Angabe der zu testenden Variable — in unserem Fall ist das die Klasse der 


20 Die Ergebnisse des Kolmogorov-Smirnov-Tests und des Shapiro-Wilk Tests (vgl. Abschn. 6.5.2) 
führen zum Verwerfen der Hypothese einer Normalverteilung. 

?! In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Nicht parametrische 
Tests > Alte Dialogfelder > 2 unabhängige Stichproben ... 
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Abb. 6.24 Mann-Whitney-U-Test mit SPSS 


Zahlungsbereitschaft. Unter Exact ... kann die Berechnung eines exakten oder asymp- 
totischen U-Tests angefordert werden. Bei kleinen Stichproben erfolgt automatisch die 
Angabe beider Testergebnisse. 

In beiden Fällen irrt man sich in p = 0,2 % der Fälle, wenn man von einer unterschied- 
lichen Zahlungsbereitschaft bei Männern und Frauen ausgeht. Frauen belegen mit einem 
durchschnittlichen Rangplatz von 8,77 eine niedrigere Zahlungsbereitschaft als Männer 
mit einem Durchschnittsrang von 17,58. 


6.3.2.2 Der Mann-Whitney-U-Test mit Stata 
Die Durchführung des U-Tests mit Hilfe der Beispieldatei Rang (Flaschendesign).dta er- 
folgt ın Stata durch die Befehlsfolge Statistics > Nonparametric analysis > Tests of 
hypotheses > Wilcoxon rank-sum test. Es Öffnet sich das in Abb. 6.25 dargestellte Fens- 
ter. Die Gruppierungsvariable — in unserem Fall Geschlecht - ist in das Feld Grouping 
Variable einzutragen. Dabei dürfen nur Variablen mit höchstens zwei Ausprägungen ver- 
wendet werden. Unter Variable erfolgt die Angabe der zu testenden Variable - in unserem 
Fall die Klasse der Zahlungsbereitschaft. 

Man irrt sich in p = 0,18% der Fälle, wenn man von einer unterschiedlichen Zah- 
lungsbereitschaft bei Männern und Frauen ausgeht. Bei den Frauen ist die unter der 
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Abb. 6.25 Mann-Whitney-U-Test mit Stata 


Annahme von Gleichheit erwartete Rangsumme mit 169 höher als die tatsächlich rea- 
lisierte Rangsumme (114). Weibliche Befragte haben somit eine signifikant geringere 
Zahlungsbereitschaft. 


6.4 Testsfür K unabhängige Stichproben 


6.4.1 Varianzanalyse (ANOVA) 


Wie wir bereits aus Abschn. 6.3.1 wissen, besteht mit dem 7-Test für zwei unabhängige 
Stichproben die Möglichkeit, den Unterschied der Mittelwerte zweier Gruppen auf Signi- 
fikanz zu überprüfen. Liegt also z.B. ein Datensatz vor, indem sowohl das Geschlecht 
als auch die Einkaufssummen eines Jahres erfasst worden sind, lässt sich mit Hilfe des 
t-Tests für unabhängige Stichproben ermitteln, ob der Wert der eingekauften Produkte 
für Männer und Frauen signifikant unterschiedlich ist. Es gibt aber auch Situationen, in 
denen man untersuchen möchte, ob sich die Mittelwerte hinsichtlich einer bestimmten 
Variable zwischen mehr als zwei Gruppen statistisch signifikant unterscheiden. Wie wür- 
de man in diesem Fall vorgehen? Wie kann man beispielsweise untersuchen, ob sich drei 
verschiedene Produktvarianten hinsichtlich ihrer durchschnittlichen Verkäufe in mehreren 
Supermärkten unterscheiden? 

Die erste naheliegende Antwort wäre die Durchführung von mehreren {-Tests für un- 
abhängige Stichproben. Für ein einfaches (einfaktorielles) Beispiel mit drei Gruppen wür- 
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Beispiele: Welche Auswirkungen haben unterschiedliche Produktvarianten (Faktor 1) ... 

1)... auf die Höhe des Umsatzes (abhängige Variable 1)? 

2)... und unterschiedliche Standorte (Faktor 2) auf die Höhe des Umsatzes (abh. Variable 1)? 

3)... auf die Höhe des Umsatzes (abhängige Variable 1) und die Anzahl verkaufter Waren 
(abhängige Variable 2)? 

4)... und unterschiedliche Standorte (Faktor 2) auf die Höhe des Umsatzes (abh. Variable 1) und 
die Anzahl der verkauften Einheiten (abh. Variable 2)? 


Abb. 6.26 Systematik der Varianzanalyse 


den sich jedoch bereits () —= 3 durchzuführende 7-Tests ergeben, bei vier Gruppen 
(4) — 6 und bei fünf schon () = 12etc. 

Es wird deutlich, dass bei einer größeren Anzahl von zu vergleichenden Gruppen die 
Anzahl der durchzuführenden {-Tests ziemlich groß würde. Zudem steigt mit der Anzahl 
der durchzuführenden /-Tests auch die Wahrscheinlichkeit, dass einer dieser Tests zufäl- 
ligerweise sıgnifikant wird. 

Aus diesem Grund werden Gruppenvergleiche mit mehr als zwei Gruppen mit Hilfe 
der sogenannten Varianzanalyse (engl.: Analysis of Variance (ANOVA)) gelöst, wobei 
es nicht eine Form der Varianzanalyse gibt, sondern man - je nach Fragestellung — ver- 
schiedene Formen unterscheidet (vgl. Abb. 6.26). Unterschieden wird dabei insbesondere 
hinsichtlich der Anzahl der Gruppierungsvariablen. Liegt lediglich eine Gruppierungsva- 
riable (z.B. Geschlecht) vor, spricht man von einer einfaktoriellen Varianzanalyse. Also 
von einer Varianzanalyse mit einem unabhängigen Faktor, der eine unterschiedliche An- 
zahl von Faktorstufen aufweisen kann. Beim Beispiel Geschlecht sind es im traditionellen 
Fall die zwei Faktorstufen männlich und weiblich. Liegen zwei und mehr Gruppierungs- 
variablen bzw. Faktoren vor, spricht man von einer mehrfaktoriellen Varianzanalyse (z.B. 
Augenfarbe und Haarfarbe). Auch hier können die Faktoren unterschiedliche Anzahlen 
von Ausprägungen aufweisen. 


6.4.1.1 Die einfaktorielle Varianzanalyse 
Versuchen wir dem einfachsten Fall der Varianzanalyse — dem der einfaktorıiellen ANOVA 
— durch ein Beispiel näher zu kommen: Ein Unternehmen möchte eine neue Pralinensorte 
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Mittelwert | Standardabweichung 
Name des Produkts -—_. Li 


| Schoko-Traum Traum 9.7572] 797.2 77 5| 0080| 


Beethoven-Kugel 9.872,0 3884| 80] 





Abb. 6.27 Deskriptive Statistiken (Beispiel Schokopralinen) 
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Abb. 6.28 Grafische Veranschaulichung der ANOVA (Beispiel Schokopralinen) 


auf den Markt bringen. Die Unternehmensführung ist sıch allerdings noch über den Na- 
men uneinig. In der Diskussion stehen Schoko-Traum, Mon Choco oder Beethoven-Kugel. 
Im Rahmen einer Marktforschungsstudie in 240 gleichwertigen Testmärkten soll die Wir- 
kung des Namens auf den Absatz untersucht werden. 

Zunächst werden für die einzelnen Namen sowie für alle Beobachtungen die Mit- 
telwerte der Absätze berechnet (vgl. Abb. 6.27). Insgesamt wurden alle Produkte ım 
Durchschnitt 9794 Mal pro Markt verkauft. Der Name Beethoven-Kugel war mit 9872 
Verkäufen überdurchschnittlich, die beiden anderen (9757 für Schoko-Traum und 9753 
für Mon Choco) unterdurchschnittlich erfolgreich. 

Stellt man die einzelnen Absatzzahlen, die den Mittelwerten aus Abb. 6.27 zugrunde 
liegen, grafisch dar (vgl. Abb. 6.28), so wird deutlich, dass sich jeder Punkt als Linear- 
kombination aus dem Gesamtmittelwert (Y), der durchschnittlichen gruppenspezifischen 
Abweichung der k unterschiedlichen Namen («&,) vom Gesamtmittelwert und einer punkt- 
spezifischen Abweichung (e,x) von der gruppenspezifischen Abweichung darstellen lässt: 


Yk=Y+QUg + Ex: (6.47) 


Die gesamte Varianz des Absatzes (Y)) lässt sich also zerlegen in einen durch die Fak- 
torstufen des Produktnamens erklärten Varianzanteil ($ 2 und einen nicht erklärten Vari- 
anzanteil (S7), sodass gilt: S} = S/ + S/. Hieraus folgt gemäß Backhaus et al. (2016, 
S. 182) für G Faktorstufen und X Beobachtungswerte innerhalb einer Faktorstufe: 

2 


Ir Ei la-N) _ KT) , ie la Fe) 
G:-K-1 u G-1 G-(K-]) 


2 
(6.48) 
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Quadratsumme Mittel der 
Quelle vom Typ III df Quadrate Signifikanz 


Korrigiertes Modell mem] | aussi] ie ‚2.05 
name ‚205 
Fehler 1 54027.080,6 | 2397| 279020| | 
Gesamt | 23.077156000 | | | 


Korrigierte 
a 54.753.072,7 | 239 
Gesamtvariation 


a R-Quadrat = ‚013 (korrigiertes R-Quadrat = ‚005) 


Abb. 6.29 ANOVA-Test der Zwischensubjekteffekte (Beispiel Schokopralinen) 


Die ANOVA versucht nun die Frage zu beantworten, ob mindestens ein &, existiert, das 
sich signifikant von Null unterscheidet. Nur dann gäbe es einen Produktnamen, der da- 
zu führt, dass sich der Absatz unter diesem Namen signifikant vom gesamten mittleren 
Absatz unterscheidet. Es wird also folgende Hypothese geprüft: 


Ha =m=03=... =dc =O versus A}: Es existiert mindestens ein &, # 0,= 
Je größer die durch die Faktorstufen erklärte Varianz (S$ 3 im Vergleich zur nicht erklärten 


Varianz ($?) ist, umso eher können wir von einem Gruppenunterschied ausgehen. Der 
Quotient der zwei Varianzen ist dabei F-verteilt:”° 








2 SSX 
Fomp =, = (6.49) 
e G(K-1) 


Je größer dieser F-Wert tendenziell ist, desto größer ist - in Abhängigkeit von den Frei- 
heitsgraden (df) — auch der Einfluss des Faktors (Produktname) auf die abhängige Variable 
(Absatz). 

Die Ergebnisse aus Abb. 6.29 ergeben, dass das „Korrigierte Modell“ insignifikant ist. 
Das heißt, dass die Variablen des Modells - bisher beinhaltet das Modell nur die Variable 
name (Produktname) — keinen Einfluss auf den Absatz ausüben. Der p-Wert der Varia- 
blen name von p = 0,205 macht dies deutlich: Man würde sich in 20,5 Prozent der Fälle 
irren, wenn man davon ausgeht, dass der Produktname einen Einfluss auf den Absatz aus- 
übt. Die oben ermittelten Unterschiede bei den Durchschnittswerten sind zwar vorhanden, 


?2 Das Ergebnis der einfaktoriellen univariaten Varianzanalyse für einen Faktor mit zwei Faktor- 
ausprägungen entspricht somit den Ergebnissen des t-Tests für unabhängige Stichproben. 


3 Bs gilt: SSy = SSH + SS; SS = DE DE, (a-T) = KIM, -r) + 


y ı >. (Y gk — 7). Es wird davon ausgegangen, dass alle Gruppen den Stichprobenumfang 
n besitzen. Entsprechende Beweise für Faktorstufen mit unterschiedlichen Umfängen finden sich 
bei Bortz (1999, S. 249ff.). 
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aber nicht groß genug, um als statistisch signifikant gelten zu können. Die Mittelwertun- 
terschiede können auch rein zufällig entstanden sein. 

Mit Statistikpaketen wıe SPSS oder Stata lassen sich ohne großen Aufwand Varianz- 
analysen durchführen. Dennoch müssen vor der Durchführung folgende wichtige Voraus- 
setzungen überprüft werden: 


e Die schwerwiegendste Annahmeverletzung der ANOVA ist die Abhängigkeit der Be- 
obachtungswerte. Dies kann u. a. entstehen, wenn sich im Rahmen von Gruppendiskus- 
sionen (-interviews) für einen bestimmten Personenkreis durch besondere Bedingun- 
gen ım Raum (Lärm, unklare Anweisungen und Fragestellungen, etc.) korrelierende 
oder abhängige Reaktionen und Antworten ergeben (Hair et al. 1998, S. 348). 

e Es sollte Varianzhomogenität (Homoskedastizität) vorliegen. Diese lässt sich mit Hil- 
fe des Levene-Tests oder des Bartlett-Tests überprüfen.”* Ist der Test insignifikant, 
unterscheiden sich die Varianzen der einzelnen Gruppen (z.B. Produktnamen) nicht 
signifikant voneinander. Liegt keine Varianzhomogenität vor, aber sind die betrachteten 
Gruppen etwa gleich groß, spielt die Verletzung der Annahme der Varianzhomogenität 
keine ausschlaggebende Rolle (Bortz 1999, S. 276). Nur bei fehlender Varianzhomoge- 
nität und gleichzeitig ungleichen Gruppengrößen sollte die ANOVA nicht angewendet 
werden. In diesem Fall muss entweder auf den nicht-parametrischen Kruskal-Wallis- 
Test (vgl. Abschn. 6.4.2) oder auf die robusten Varianten der ANOVA nach Brown- 
Forsythe (1974) oder Welch (1947) zurückgegriffen werden. 

e Streng genommen muss die abhängige Variable einer sogenannten multivariaten Nor- 
malverteilung folgen. Nicht selten wird für jede betrachtete Gruppe einzeln die Bedin- 
sung der Normalverteilung der abhängigen Variable überprüft. Obwohl dies keinesfalls 
die Existenz einer multivariaten Normalverteilung garantiert, so bleibt ein Verstoß 
gegen diese Annahme häufig ohne größere Konsequenzen. Mit zunehmender Stich- 
probengröße spielt diese Anwendungsvoraussetzung keine gewichtige Rolle (Hair et 
al. 1998, S. 349). 

e Die Stichproben sollten repräsentativ und ausreichend groß sein. 


Führt man den Levene-Test oder den Bartlett-Test für das obige Beispiel durch, so ergibt 
sich ein sıgnifikanter Unterschied beı der Streuung der Absätze der einzelnen Produktna- 
men. Dieser Verstoß gegen die Voraussetzung der Varianzgleichheit führt dazu, dass die 
Ergebnisse nicht ohne Weiteres interpretiert werden dürfen. Da die Gruppen allerdings alle 
gleich groß sind, wirkt diese Annahmeverletzung 1. d.R. nicht allzu stark auf die Ergebnis- 
se. Ähnliches gilt für die Verletzung der Annahme der Normalverteilung: Zwar ergeben 


?4 Zum Teil wird der Bartlett-Test zur Überprüfung der Varianzgleichheit herangezogen. Dieser Test 
reagiert allerdings sehr sensitiv bei Abweichungen von der Normalverteilung. Deshalb wird der 
robustere Levene-Test vorgezogen. SPSS berechnet den Levene-Test auf Varianzgleichheit automa- 
tisch bei Berechnung der ANOVA. Stata bestimmt mit der Oneway-ANOVA zunächst „Bartlett’s 
test for equal variances‘“. Eine Berechnung des Levene-Tests (w_0) ist unter der Rubrik der Hypo- 
thesentests allerdings ebenfalls möglich. 
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sich für alle Produktnamen signifikante Abweichungen von der Normalverteilung,” al- 
lerdings ist die Stichprobe mit 240 Beobachtungen so groß, dass über den Verstoß gegen 
die Normalverteilung an dieser Stelle hinweg gesehen werden kann. Dennoch ist es rat- 
sam, in einem solchen Fall die Ergebnisse nochmals mit dem Kruskal-Wallis-Test (vgl. 
Abschn. 6.4.2) zu überprüfen. Auch dieser bestätigt die fehlende Signifikanz des Produkt- 
namens auf den Absatz. 


6.4.1.2 Die mehrfaktorielle Varianzanalyse 

Wie oben bereits angemerkt, sind es in der Praxis selten einzelne, sondern eher Bündel von 
Effekten, die einen Einfluss auf einen Sachverhalt ausüben. Obiges Beispiel soll deshalb 
um Informationen über die Verpackungsfarbe erweitert werden. Obwohl der Produktname 
zunächst keinen signifikanten Einfluss ausübt, entscheidet sich das Unternehmen aufgrund 
langjähriger Erfahrung für den Produktnamen Beethoven-Kugel. Um zu überprüfen, wel- 
che Verpackungsfarbe sinnvoll ist, wird eine mehrfaktorielle ANOVA durchgeführt (vgl. 
Abb. 6.30). 

In diesem Fall ergibt sich für den Levene-Test ein insignifikantes Ergebnis (@ = 0,476), 
sodass bei diesem zweifaktoriellen Modell nicht gegen die Voraussetzung der Varianzho- 
mogenität verstoßen wird. 

Im zweifaktoriellen Modell lassen sich die einzelnen Beobachtungen als Linearkom- 
bination aus dem Gesamtmittelwert (Y ), der durchschnittlichen namensspezifischen Ab- 
weichung («,), der durchschnittlichen farbspezifischen Abweichung der Verpackung (ß,,) 
und einer punktspezifischen Abweichung (e,;) darstellen: 


Yr=Y +9; +Bßn + Egk. (6.50) 


Allerdings gibt es noch einen weiteren Effekt, nämlich den sogenannten Interaktionsef- 
fekt zwischen Produktname und Produktfarbe, sodass die Linearkombination schließlich 
folgende Form aufweist:”° 


Yk=Y+Qe+Pn + @Ben + Eek- (6.51) 


> Die Ergebnisse des Kolmogorov-Smirnov-Tests und des Shapiro-Wilk Tests (vgl. Abschn. 6.5.2) 
führen zum Verwerfen der Hypothese einer Normalverteilung. 
?6 Es gilt wiederum folgende Zerlegung: 

Sy =SSx, +5Sx, +8Sy,x + SSe; 


G 


SSy=H:K- >.-n) +08. (IR-M) 


Es wird davon ausgegangen, dass alle Gruppen den Stichprobenumfang n besitzen. Entsprechende 
Beweise für Faktorstufen mit unterschiedlichen Umfängen finden sich bei Bortz (1999, S. 249ff.). 
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a R-Quadrat = ‚826 (korrigiertes R-Quadrat = ‚823) 





Abb. 6.30 ANOVA Test der Zwischensubjekteffekte und deskriptive Statistik 


Die Ergebnisse aus Abb. 6.30 ergeben, dass das „Korrigierte Modell“ nun signifikant ist, 
sodass mindestens eine der unabhängigen Variablen einen Einfluss auf den Absatz ausübt. 
Der p-Wert der Variable farbe liegt bei 0,000, sodass man sich ın weniger als p < 0,5 % 
der Fälle irrt, wenn von einem Einfluss der Verpackungsfarbe auf den Absatz ausgegan- 
gen wird. Ansonsten hätte der p-Wert p = 0,001 sein müssen. Insgesamt ist die Farbe 
Blau mit durchschnittlichen 9982 verkauften Produkten erfolgreicher als die Farbe Gelb 
mit 9606 Produkten. Auch der Produktname ist in diesem zweifaktoriellen Modell nun 
sıgniıfikant. Insgesamt wird der Name Beethoven-Kugel mit durchschnittlich 9872 Ver- 
käufen am besten vom Kunden angenommen. Die Kombination aus der durchschnittlich 
besten Farbe und dem durchschnittlich besten Produktnamen ergibt im voreiligen Schluss 
eine scheinbar optimale Produktkonfiguration einer blau eingepackten Beethoven-Kugel, 
würden da nicht die oben bereits erwähnten Interaktionseffekte wirken. 
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Schoko-Traum Mon Choco Beethoven Kugel 
Name des Produktes 


Abb. 6.31 Randmittel des Absatzes (Beispiel Schokopralinen) 


Bei mehrfaktoriellen Varıanzanalysen sollten diese immer berücksichtigt werden. Bei 
zweifaktoriellen Modellen ergibt sich ein potentieller Interaktionseffekt, bei dreifaktori- 
ellen Modellen ergeben sich drei Interaktionseffekte, bei vierfaktoriellen Modell sechs 
etc. Ob diese auch signifikant sein werden, entscheidet sich durch die ANOVA. Was ge- 
nau bedeutet nun dieser Interaktionseffekt? Am besten lässt sich dies durch die grafische 
Darstellung der Randmittel — also der Mittelwerte der unterschiedlichen Produktkonfigu- 
rationen — veranschaulichen (vgl. Abb. 6.31). 

Es läge kein Interaktionseffekt vor, wenn die Kurven der Randmittel (nahezu) parallel 
verlaufen würden. Dann würde die Kurve der Farbe mit dem größten Durchschnitts- 
wert — im Beispiel ist das Blau — immer im gleichen Abstand über der Kurve der Farbe 
Gelb liegen. Der Abstand zwischen den beiden parallel verlaufenden Farbkurven ent- 
spräche immer dem Unterschied zwischen den durchschnittlichen Wirkungen der beiden 
Farben. Mögliche Niveauunterschiede kämen ausschließlich aufgrund der verschiedenen 
Wirkungen der Produktnamen zustande. Die Wirkung der Farbe und die Wirkung des 
Produktnamen auf den Absatz wären dann unabhängig voneinander. Der Unterschied zwi- 
schen einer blau und einer gelb eingepackten Beethoven-Kugel wäre der gleiche wıe der 
Unterschied zwischen einer blau oder gelb verpackten Schoko-Traum-Praline. 

Besteht — wie in unserem Beispiel — nun aber ein signifikanter Interaktionseffekt, dann 
weichen die beiden Linien in einem bestimmten Umfang von der Parallelität ab. Die Far- 
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X, X, X; 


2. Ordinal Interaktionseffekt 4. Disordinaler Interaktionseffekt 
(Cross Over) 


Abb. 6.32 Interaktionseffekte bei zweifaktorieller ANOVA 


ben wirken nicht bei allen Produktnamen gleichmäßig stark, sondern sie wirken je nach 
Produktname unterschiedlich. Auf unser Beispiel bezogen sıeht man deutlich, dass die 
Farbe Blau für Schoko-Traum und Mon Choco bessere Wirkungen erzielt als Gelb. Aber 
bereits bei diesen beiden unterscheidet sıch die Wirkung, denn die blaue Farbe wirkt bei 
Schoko-Traum stärker als bei Mon Choco. Bei der Beethoven-Kugel hingegen ist die Wir- 
kung der blauen Farbe sogar negativ, sodass man sich an dieser Stelle für eine gelbe 
Verpackung entscheiden sollte und somit zu einer anderen Konfiguration von Farbe und 
Name gelangt, als aufgrund der ersten voreiligen Betrachtung der Gesamtmittelwerte. Hier 
hätte man sich fälschlicherweise für eine blau verpackte Beethoven-Kugel entschieden. Es 
ist bei signifikanten Interaktionseffekten also entscheidend, nicht ausschließlich die Ge- 
samtmittelwerte, sondern ebenfalls die Randmittel ın die Interpretation mit einzubeziehen. 

Das Zusammenspiel zwischen Farbe und Name oder, generell gesagt, das Zusam- 
menspiel zwischen zwei Faktoren wird also durch den Interaktionseffekt zum Ausdruck 
gebracht. Mögliche Verläufe von Interaktionseffekten sind in Abb. 6.32 dargestellt. 

Wenn sich die einzelnen Faktorstufen hinsichtlich der Kundenpräferenz signifikant 
unterscheiden, stellt sich die Frage, welche Faktorstufen eine höhere Kundenpräferenz 
erzeugen, welche eine niedrigere und welche Faktorstufen sich nicht unterscheiden. Hier- 
für nun wiederum einzelne t-Test-Kombinationen durchzuführen, würde — wie bereits 
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(I) Name des | (J) Name des Mittlere Stan- | Sig. PRREEEEEEE 
Produktes Produktes Differenz | dard- 95% Konfidenzintervall 
A-J) fehler 
U-Grenze | O-Grenze 


Schoko- -74,779 82,279 
Traum Beethoven-Kugel -114,8(*) -193,33 -36,271 


Mon Choco Schoko-Traum -82,279 74,779 


Beethoven-Kugel -118,6(*) 197,079 -40,021 
Beethoven- Schoko-Traum 114,8(*) 36,271 193,329 


* Die mittlere Differenz ist auf der Stufe ‚05 signifikant. 





Abb. 6.33 Mehrfachvergleiche Scheffe-Test (Beispiel Schokopralinen) 


geschildert — die Wahrscheinlichkeit einer irrtümlichen Annahme von Unterschieden, also 
das Auftreten des Fehlers erster Art, erhöhen. Es stehen allerdings Verfahren zur Ver- 
fügung, die versuchen, diesen Fehler zu kontrollieren. Diese Multiple Comparison Pro- 
cedures werden in der Literatur häufig auch als Post-hoc-Methoden oder Mehrfachver- 
gleichsverfahren bezeichnet. In Abb. 6.33 ist für das gegebene Beispiel der sogenannte 
Scheffe-Test durchgeführt worden: Der Produktname Beethoven-Kugel unterscheidet sich 
— da mit einem * gekennzeichnet — auf dem 5-Prozent-Niveau von den beiden anderen 
Namen. Die beiden anderen Namen unterscheiden sich nicht voneinander, sodass sich die 
Sıgnifikanz des Faktors Produktname vor allem aus der signifikanten Abweichung des 
Namens Beethoven-Kugel erklärt. 

Die Besonderheit des Scheffe-Tests ist es, dass es tatsächlich nur dann zu Einzel- 
unterschieden kommen kann, wenn sich auch der entsprechende Faktor als insgesamt 
signifikant herausgestellt hat. Außerdem versucht dieser Test in besonders starkem Maß 
das Auftreten des Fehlers erster Art gering zu halten. Dies kann im Zweifel auch zu ei- 
nem Nichterkennen von tatsächlich vorhandenen Unterschieden führen (Scheffe 1953, 
S. 87ff.). Der Scheffe-Test gilt diesbezüglich als einer der konservativsten Post-hoc-Tests. 
Je größer die Stichprobe allerdings ist und je weniger Gruppen zu vergleichen sind, des- 
to eher werden bestehende Unterschiede tatsächlich auch aufgedeckt (Hair et al. 1998, 
S. 356). Untersuchungen haben festgestellt, dass die folgenden Mehrvergleichsverfahren 
in genannter Reihenfolge an „Konservativismus“ abnehmen: (1) Scheffe, (2) Tukey HSD, 
(3) Tukey LSD, (4) Newman-Kuels und (5) Ducan (Stevens 1972). 


6.4.1.3 Die Kovarianzanalyse (ANCOVA) 

Nicht alle Einflussvariablen besitzen ein nominales — also klassierendes — Skalenni- 
veau. Für viele Fragestellungen ist die gleichzeitige Berücksichtigung metrischer Skalen 
von Interesse. So lässt sich obiges Beispiel durch die Einbeziehung des jeweiligen 
Abverkaufspreises ergänzen und der gemeinsame Einfluss des Preises als sogenannte 
Kovariable - manchmal auch als Kovariate (engl.: covariate) bezeichnet — und der Grup- 
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pierungsfaktoren Farbe und Produktname mit Hilfe der Kovarianzanalyse (ANCOVA) 
berechnen. 

Es ergibt sich eine Erweiterung des zweifaktoriellen Modells dahingehend, dass jede 
Beobachtung neben den durchschnittlichen namens- und farbspezifischen Abweichun- 
gen (a,, ß„) auch durch den Steigungskoeffizient der Kovariable Preis (x) erklärt werden 
kann: 

Yk=Y+Qs+Pßn + @Ben + 6x + Egk. (6.52) 


Mit ö ergibt sich gewissermaßen eine auf regressionsanalytischem Wege ermittelte Stärke 
der Wirkung der unabhängigen Variable Preis (x) auf die abhängige Variable Absarz über 
alle Gruppen. Es wird also davon ausgegangen, dass die Kovariable über alle Faktoren 
(Gruppen) den gleichen Einfluss auf die abhängige Variable ausübt. 

Es stellt sich somit folgende Frage: Bleiben in unserem Beispiel nun die namens- und 
farbspezifischen Abweichungen signifikant, auch wenn der Verkaufspreis mit berücksich- 
tigt oder methodisch formuliert: der Preiseffekt vorher herausgerechnet wird’? 

Die in Abb. 6.34 dargestellten Ergebnisse der ANCOVA’”’ stellen die vorherigen Ergeb- 
nisse quasi auf den Kopf. Während die Nichtberücksichtigung des Preises im vorherigen 
Abschnitt den Eindruck erwecken, dass Name und Farbe des Produktes eine Rolle für den 
Absatz spielen, kommt hier eine völlig neue Erkenntnis zutage: Es ist letztlich nur der 
Verkaufspreis der Produkte für die Höhe des Absatzes entscheidend. Rechnet man diesen 
Preiseffekt heraus, führen die weiteren Variablen - hier die Faktoren Farbe und Name -— 
zu keinem weiteren Erklärungswert, sie erweisen sich als insignifikant. Der p-Wert für 
den Faktor Farbe ıst p = 0,924 und für den Faktor Produktname p = 0,537. Vergleicht 
man die Randmittel nach Herausrechnung der Verkaufspreise in Abb. 6.35 mit der nıcht 
herausgerechneten Variante in Abb. 6.31, so führt die Insignifikanz der Faktoren zu einem 
fehlenden Abstand zwischen den Randmitteln. 

An dieser Stelle sei angemerkt, dass 


l. die für einen Signifikanztest zur Verfügung stehende Anzahl der Freiheitsgrade mit je- 
der neu hinzu genommenen Kovariablen sinkt. Es müsste im Gegenzug die Stichprobe 
erhöht werden, um den Rückgang zu kompensieren. Es sollten deswegen so wenig 
wie möglich - aber alle erklärungskräftigen — Kovariablen berücksichtigt werden. Als 
Faustregel für die maximale Anzahl an Kovariablen gilt: Anzahl der Kovariablen = 
(0,1 - Stichprobenumfang) — (Anzahl der Gruppen — 1); 

2. bei der Kovarianzanalyse davon ausgegangen wird, dass die Kovariable über alle Fak- 
toren (Gruppen) den gleichen Einfluss auf die abhängige Variable ausübt. 


?7 Die Voraussetzungen zur Durchführung der ANCOVA gelten analog zur ANOVA. Weder die Va- 
rianzhomogenität kann aufgrund des Sıgnifikanzniveaus des Levene-Tests (p = 0,462) verworfen, 
noch kann die Normalverteilung für vier von sechs Kombinationen aus Produktfarbe und -name aus 
Sicht des Kolmogorov-Smirnov-Tests verworfen werden. Die untersuchte Einheit ist zudem mit 240 
Beobachtungen ausreichend groß. 
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EEIERERTERITETE 
Quelle vom Typ III df Quadrate F kanz 

Fehler 00 | Harael  a | 
Gesamt | 2sozzuscono| Mal | 


Korrigierte 
on 54.753:072.7 239 
Gesamtvariation 


a R-Quadrat = ‚998 (korrigiertes R-Quadrat = ‚,998) 

Lesehilfe: 

Die Einflussvariablen Produktfarbe und Produktname sowie der Interaktionseffekt dieser 
beiden Variablen sind insignifikant und üben somit keinen Einfluss auf die Verkaufs- 





zahlen aus. Der Einfluss Preis ist hingegen signifikant: Man irrt sich in weniger als 
0,05% der Fälle (da die Größe des p-Wertes ansonsten hätte 0,001 betragen müssen), 
wenn man von einem Einfluss des Preises auf die Verkaufszahlen ausgeht. 


Abb. 6.34 ANCOVA-Test der Zwischensubjekteffekte (Beispiel Schokopralinen) 
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Abb. 6.35 Randmittel des Absatzes bei einer ANCOVA (Beispiel Schokopralinen) 
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Letzteres bedeutet, dass eine Kovarianzanalyse eine Varianzanalyse über die Regressions- 
residuen der Regression zwischen den Kovariablen einerseits und der abhängigen Varı- 
able andererseits darstellt.”° Letztlich macht dies die enge Verwandtschaft zwischen der 
Varianz- und der Regressionsanalyse deutlich, denn die einzelnen Faktoren ließen sich 
auch in einer Regression als Dummy-Variablen berücksichtigen. Nach einer Regressions- 
analyse wären neben den einzelnen Signifikanzen dann auch die marginalen Effekte der 
einzelnen Faktorausprägungen bekannt. Aus diesem Grund sollte gut überlegt werden, ob 
nicht sofort auf die Regressionsanalyse zurückgegriffen wird, da durch sie mehr Informa- 
tionen herausgearbeitet werden können. 

Neben den genannten varianzanalytischen Verfahren existiert noch die sog. Multiva- 
rıate ANOVA - auch MANOVA genannt. Diese liegt vor, wenn der Einfluss von Faktoren 
und ggfs. von Kovariablen auf mehrere abhängige Variablen gleichzeitig in derselben Va- 
rıanzanalyse untersucht wird. Die abhängigen Variablen werden sozusagen zu einem Wert 
zusammengefasst. Eine solche Analyse ist nur dann mehreren univariaten Varianzanaly- 
sen vorzuziehen, wenn die abhängigen Variablen miteinander in Zusammenhang stehen. 
Beispielsweise könnte man untersuchen, ob ein gleichzeitiger Einfluss zwischen den un- 
abhängigen Faktoren Art der Werbebotschaft (X) und Markenname (X,) auf die beiden 
abhängigen Variablen Oualitätswahrnehmung (Yı) und Preiswahrnehmung (Yı) besteht: 


Y1:J0= 7 &1,25::.:325) (6.53) 


Dabei lässt sich die Signifikanz eines Einflusses mit Hilfe von unterschiedlichen Kenn- 
zahlen (Wilks’ Lambda, Hotelling-Spur, Wurzel nach Roy, Pillai-Spur, etc.) bestimmen, 
auf deren Herleitung und weitere Darstellung an dieser Stelle verzichtet wird. 


6.4.1.4 Berechnung der Varianzanalyse mit SPSS 

Anhand der Beispieldatei schokopraline_farbe_name_preis.sav wollen wir in SPSS die 
ANOVA/ANCOVA durch die Befehlsfolge Analyze > General Linear Model — Univa- 
riate ....”” berechnen. Es öffnet sich die Dialogbox aus Abb. 6.36, in der die abhängige 
Variable (absatz), die unabhängigen nominalen Faktoren (Farbe und Name des Produkts) 
und mögliche Kovariablen (beispielsweise der Preis) eingegeben werden. Weitere Schritte 
sowie Ergebnisse und Interpretationen lassen sich Abb. 6.36 entnehmen. 


6.4.1.5 Berechnung der Varianzanalyse mit Stata 

Nach Öffnung der Datei schokopraline_farbe_name_preis.dta in Stata erfolgt die Vari- 
anzanalyse durch die Befehlsfolge Statistics — Linear models and related — ANOVAY- 
MANOVA — Analysis of variance and covariance. Es Öffnet sich die Dialogbox aus 


?8 Streng genommen müssten bei einer ANCOVA auch alle Maßnahmen der Regressionsdiagnostik 
(Heteroskedastizität, Autokorrelation, Multikollinearität etc.) durchgeführt werden (vgl. beispiels- 
weise Cleff (2015)). 

In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren — Allgemeines lineares 
Modell — Univariat ... 
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Abb. 6.36 Varianzanalyse mit SPSS 


Abb. 6.37, ın der die abhängige Variable (absatz), die nominalen Faktoren (Farbe und 
Name des Produkts) und mögliche Kovariablen (beispielsweise der Preis) eingegeben wer- 
den. Die Kovarıablen werden kenntlich gemacht, indem dem Variablennamen das Präfix 
„ec.“ vorangestellt wırd. Möchte man also den Preis als Kovariable berücksichtigen, erfolgt 
die Eingabe durch c.variablennamen, also in unserem Beispiel durch c.preis. 

Die Berücksichtigung von Interaktionseffekten zweier Variablen erfolgt durch Eingabe 
der beiden Variablennamen die durch die Zeichenfolge „##“ verbunden werden. In unse- 
rem Beispiel berücksichtigt die Eingabe von name##farbe den Interaktionseffekt der Fak- 
toren Name und Farbe des Produkts. Darüber hinaus können auch Interaktionseffekte mit 
mehr als zwei Variablen berücksichtigt werden, indem alle betroffenen Variablen - jeweils 
durch „##°“ verbunden - hintereinander aufgeführt werden (varı ##var##... #Fvar,). 


6.4.1.6 Berechnung der Varianzanalyse mit Excel 
Sind in Excel mit dem Add-Ins-Manager die Module Analyse-Funktionen und Analyse- 
Funktionen-VBA aktiviert,’ lassen sich einfache Formen der ein- oder zweifaktoriellen 


>0 Für Excel 2010 ist dieser über die Schaltflächenkombination Datei > Optionen — Add-ins — 
Gehe zu erreichbar. 
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_] anova - Analysis of varlance and owarlance re Auswahl der abhängigen Variablen (absatz) 
Model | Ach. maochel | by | wighls 
m Für eine einfaktorielle ANOVA muss genau ein 


EIRDaEKE VEN Faktor (z.B. farbe oder name) eingegeben werden. 

m Für eine mehrfaktorielle ANOVA müssen 
mindestens zwei Faktoren (z.B. farbe und name) 
eingegeben werden. 

Für eine mehrfaktorielle ANOVA mit 
Interaktionseffekt müssen mindestens zwei Faktoren 
(z.B. farbe und name) eingegeben werden. Die 
Berücksichtigung von Interaktionseffekten erfolgt 
durch Eingabe der beiden Variablennamen, die 
durch die Zeichenfolge „##” verbunden werden (z.B. 
namet##farbe). 

Bei einer ANCOVA werden die Kovariate kenntlich 
gemacht, indem dem Variablennamen das Prefix 
„ce.“ vorangestellt wird (Z.B. c.preis). 
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Menüsteuerung: Einfaktorielle ANOVA: 

Statistics > Linear models and related > ANOVA > One-way ANOVA 
Im Hauptmenü: 
> Multiple comparison test: Scheffe-Test anklicken 

















Menüsteuerung: Mehrfaktorielle ANOVA/MANOVA: 
Statistics > Linear models and related > ANOVA > Analysis of variance and covariance 





Menüsteuerung: Levene-Test: 
Statistics > Summaries, tables, and tests — Classical tests of hypotheses — Robust equal - 
variance test 





Relevante Syntaxbefehle der Varianzanalyse: 
anova; anova_postestimation; anovadef; hotelling; loneway; oneway; manova; manova 
postestimation; sdtest; robvar 





Abb. 6.37 Varianzanalyse mit Stata 


ANOVA durchführen. Darüber hinaus ist die Berechnung mehrfaktorieller Analysen nicht 
möglich. In diesem Fall sollte der Leser die Verwendung von professionellen Statistikpa- 
keten (z.B. SPSS oder Stata) in Erwägung ziehen. Grundlage für die Durchführung der 
ANOVA ist wiederum die Überprüfung der Annahme der Varianzgleichheit. Hierzu wird 
auf die in Abschn. 6.3.1.3 beschriebene Vorgehensweise des F-Tests mit Excel verwie- 
sen. Die Gruppenvarianzen müssen dabei einzeln miteinander verglichen werden. Je mehr 
Gruppen vorliegen, umso mehr vergleichende Zweistichproben- F-Tests sind durchzufüh- 
ren. Die Möglichkeit eines einzigen (Omnibus-)Tests (z. B. Levene-Test) zur Überprüfung 
der Annahme der Varianzgleichheit existiert in Excel nicht. 

In Abb. 6.38 ıst der Datensatz Schokopraline_Name_Analysis_Excel.xis mit Absatz- 
zahlen von Pralinen mit unterschiedlichen Namen beispielhaft dargestellt. Die Anzahl der 
Beobachtungen in jeder Gruppe muss bei der Analyse nicht zwangsläufig identisch sein. 
Über die Menüfolge Daten — Datenanalyse — Anova: Einfaktorielle Varianzanalyse 
kann dann überprüft werden, ob sich die Absatzzahlen mindestens zweier Produktna- 
men im Mittel voneinander unterscheiden. Hierzu ist im Eingabefenster der Datenbereich 
$A$1:8C$30 der drei zu vergleichenden Produktnamen unter Eingabebereich: einzuge- 
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ä Gruppen Anzahl SUrnTae Mirtelwert Varlkanmz 2 
5 Ahbsats Schokotraum 19 195756 10202.95 54189.27 p-Wert der ANOVA: Unterschied 
5 Absatz Mon Choco 29 293594 1123.93  IT6BR1E ist signifikant (p<0,05). 

7 Absatt Beethenenkugel 24 228005 9500.21 31483. 

8 

9 
10 ANCYA 

Alırtlere 
Churdrat- Oßsdrotsurmme  Prüfgräße kritischer F 

1 Streuwmgsunssche summen (55) Freiheitsgrade tdi) fa} fr} P-Wiert Wert 
1 Unserschhede swsichen den Gruppen 8087007.22 2 4043503.61 112.77 0.00 3.13 
13 Innerhalb der Gruppen 24742070,77 54 35356.10 


14 
15 Gesami 10551078 71 


Abb. 6.38 Varianzanalyse mit Excel 


ben. Da die drei Gruppen spaltenweise angeordnet sind, ıst unter Geordnet nach: die 
Kategorie Spalten zu wählen und unter Beschriftung in der ersten Zeile durch einen Haken 
zu vermerken, dass in der ersten Zeile des Eingabebereiches die Produktnamen aufgeführt 
sind. Danach wird mit OK bestätigt. Es ergeben sich die in Abb. 6.38 unten aufgeführten 
Ergebnisse. Da der p-Wert mit p = 0,00 < 0,05 ist, unterscheiden sich die durchschnitt- 
lichen Absatzzahlen von mindestens zwei der drei Gruppen signifikant voneinander.°! 


6.4.2 Kruskal-Wallis-Test (H-Test) 


Im letzten Kapitel haben wir mit der Varianzanalyse ein Verfahren kennengelernt, wel- 
ches unter bestimmten Annahmen den Vergleich von mehr als zwei Gruppen hinsichtlich 


1 Sehr gute Darstellungen über die Vorgehensweise bei Excel finden sich hier: https:// 
www.youtube.com/watch?v=tPGPV_XPw-o und hier: https://www.youtube.com/watch’?v= 
JfUfSDR2AZzs. 
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des Mittelwerts einer metrischen Variablen erlaubt. Was ıst aber zu tun, wenn die An- 
wendungsvoraussetzungen nicht erfüllt sind, weil beispielsweise ordinalskalierte Daten 
vorliegen oder die Daten weder normalverteilt noch homoskedastisch sind? 

In Fortführung des Beispiels aus Abschn. 6.3.2 könnte man sich beispielsweise fragen, 
ob sıch drei verschiedene Kundengruppen (A-Kunde, B-Kunde, C-Kunde) in ihrer ordinal 
gemessenen Zahlungsbereitschaft unterscheiden (vgl. Abb. 6.39). Eine erste Möglıch- 
keit wäre die mehrfache Durchführung von Mann-Whitney-U-Tests für zwei unabhängige 
Stichproben. Mit zunehmender Anzahl der zu vergleichenden Gruppen steigt die Anzahl 
der durchzuführenden Mann-Whitney-U-Tests um ein Vielfaches. Zudem steigt die Wahr- 
scheinlichkeit, dass einer dieser Tests zufälligerweise signifikant wird. 

Aus diesem Grund wird zur Überprüfung von Gruppenunterschieden bei mehr als 
zwei Gruppen — also bei k unabhängigen Stichproben/Gruppen - hinsichtlich der Aus- 
prägung einer ordinalen oder metrischen Variable der sogenannte H-Test von Kruskal- 
Wallis (1952, 1953) verwendet. Dieser Test ist vor allem dann anzuwenden, wenn die 
Anwendungsvoraussetzungen der Varianzanalyse (vgl. Abschn. 6.4.1) nicht erfüllt sind. 
Die Grundidee des H-Tests ist der des U-Tests (vgl. Abschn. 6.3.2) zum Teil identisch. Er 
überprüft, ob sich die durchschnittliche Rangzahl mindestens einer Gruppe von der einer 
anderen Gruppe signifikant unterscheidet. Es werden also folgende Hypothesen überprüft: 


1. Schritt: Formulierung der Hypothesen 


Ho: E(R;) = E(R;) für allei £ j 
Hı: E(R;) # E(R;), für mindestens ein beliebigesi #£ j 


2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von «& obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe 

In unserem Beispiel wird eine Stichprobe im Umfang von n = 25 gezogen. Die drei 
Teilstichproben umfassen dabei n; = 5 A-Kunden, nz = 11 B-Kunden und n; = 9 
C-Kunden. 
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von Pe] Ordnen 

Berechnung 

Kunde N Mean Rank 

Klasse der A-Kunde 5 19.30 

Zahlungsbereitschaft grunde 11 13.55 

Test Statistics?» 

Klasse Zahlungsbereitschaft 

| mn 
Exact Sig. 022 
Point Probability .000 
a Kruskal Wallis et 


b Grouping Variable: Kunde 


Abb. 6.39 Kruskal-Wallis-Test (H-Test) 


4. Schritt: Überprüfung der Testvoraussetzungen 


Metrisches oder ordinales Skalenniveau der Testvariable 
Es liegt eine Zufallsstichprobe vor 
Die Stichproben sind unabhängig voneinander 


<a]lS]% 


Testvariable sollte in den Gruppen annähernd die gleiche 
Verteilungsform aufweisen 


5. Schritt: Bestimmung des empirischen Testwerts 
In Abb. 6.39 liegt die auf einer fünfstufigen Skala [l = 0-5€; 2 = 5,01-10€;, 3 = 
10,01-15 €; 4 = 15,01-20 €, 5 = 20,01-25 €] gemessene, ordinalskalierte Zahlungsbe- 
reitschaft von drei Kundengruppen (A, B, C) für eine bestimmte Weinsorte vor. Der H-Test 
überprüft nun, ob sich mindestens eine der Kundengruppen hinsichtlich ihrer durchschnitt- 
lichen Zahlungsbereitschaft sıgnifikant unterscheidet. 
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Um diese Frage beantworten zu können, erfolgt — unter Berücksichtigung von Rang- 
bindungen -— zunächst die Vergabe von Rangplätzen (vgl. Schritt 1 in Abb. 6.39). Danach 
werden die Rangplätze der Befragten jeweils gruppenspezifisch zugeordnet (vgl. Schritt 
2 ın Abb. 6.39). Da viermal die niedrigste Zahlungspräferenz ausgewählt wurde, erhalten 
alle diese Personen eine 


1+2+43+4 


25. 6.54 
1 (6.54) 


Rangzahl von 
Dies gilt für drei Personen der Kundengruppe C und für eine Person der Kundengruppe 
B. Entsprechend wird diesen der Rangplatz 2,5 zugeordnet. Gleichermaßen wird mit den 
restlichen Zahlungsbereitschaften verfahren. Danach werden gruppenweise alle Rangplät- 
ze zu Rangsummen aufaddiert, sodass sich für Gruppe A ein Wert von 96,5, für B ein Wert 
von 149 und für C ein Wert von 79,5 Rangplätzen ergibt. Aufgrund der unterschiedlichen 
Anzahl an Beobachtungen, erfolgt durch Division der gruppenspezifischen Fallzahlen die 
Berechnung der jeweiligen durchschnittlichen Rangplätze: Im Durchschnitt belegen die 
Kunden der Gruppe A den 19,3-ten (= 96,5/5), die Kunden der Gruppe B den 13,6-ten 
(= 149/11) und die Kunden der Gruppe C den 8,8-ten Rang. 

Sollten alle Kundengruppen die gleiche Zahlungsbereitschaft aufweisen, so dürften 
sich die ermittelten durchschnittlichen Ränge nicht maßgeblich unterscheiden. Analog 
zum Mann-Whitney-U-Test muss also auch hier überprüft werden, welche Rangzahl man 
erwarten kann, wenn sich die Gruppen nicht unterscheiden würden. Für alle Beobachtun- 
gen wird eine gesamte Rangplatzsumme von 1 +2+3-+... + n vergeben, die letztlich 


auch mit Hilfe von 
n-(n-+]) 


2 


berechnet werden kann. Für das Beispiel von 25 Befragten ergibt sich eine gesamte Rang- 


(6.55) 


summe von 
n-(n+1)  25-(25+1) 


2 


Teilt man die Rangsumme nun durch die Anzahl aller Beobachtungen, erhält man den 


— 325 Rangplätzen. (6.56) 


Erwartungswert für den durchschnittlichen Rang unter der Annahme, dass sich die durch- 
schnittlichen Ränge der Gruppen nicht unterscheiden. Für das gegebene Beispiel heißt 
dies: 


Da ren 


E(R _mGa+l) _ a+l) _ tl _ 


13. (6.57) 
n 2»Nn 2 2 


Der Vergleich mit den tatsächlich realisierten Durchschnittsrängen (19,3; 13,6; 8,8) zum 
Erwartungswert (E (R) — 13) legt die Vermutung nahe, dass sich die Gruppen unterschei- 
den. Sind die Unterschiede zwischen den durchschnittlichen Rängen der drei Gruppen nun 
aber groß genug, um als statistisch signifikant zu gelten? 
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Zur Überprüfung wird zunächst die Summe aller quadrierten — also vom Vorzeichen 
unabhängigen — Abweichungen der tatsächlichen durchschnittlichen Ränge zum Erwar- 
tungswert gebildet: 


SR -E(R) ?=5 (R, u a (6.58) 


jel jel 
Für unser Beispiel ergibt sich demnach: 
(19,3 — 13)? + (13,6 — 13)? + (8,8 - 13)? = 57,7. (6.59) 


Ist diese Gesamtabweichung von 57,7 viel oder wenig? Oder anders gefragt: Ist sie sig- 
nifikant oder nicht? Diese Frage lässt sich nur beantworten, wenn man eine theoretische 
Verteilung findet, die sich genauso verhält, wie die quadrierten Gesamtabweichungen der 
durchschnittlichen Ränge vom Erwartungswert. 


6. Schritt: Bestimmung des kritischen Testwerts 

Teilt man zu diesem Zweck die oben ermittelte Summe der quadrierten Abweichungen 
durch die Varianz der Ränge, erhält man einen Wert, der mit 7 bezeichnet wird. Es 
lässt sich zeigen, dass die Summe der Abweichungen geteilt durch die Varianz der Ränge 
mit k — 1 Freiheitsgraden asymptotisch Chi-Quadrat-verteilt ist (Bortz, Lienert, Boehnke 
(2000, S. 222ff.): 


u 
He >> RER) Yo. (6.60) 
je n; 


Der H-Wert geht von einer unendlich großen Grundgesamtheit aus. Liegt hingegen eine 
endliche Grundgesamtheit vor — und das dürfte die Regel sein — muss hierfür korrigiert 
werden, sodass gilt: 





oe — 12 k (BR. _ N+1\2 
Nej1 R;:-E(R N-1 R:= 
perdich _ z ) RER) = er ) 2) a I (6.61) 
je n; a! 12-n; 


Wird zusätzlich noch um Rangbindungen korrigiert, ergibt sich die — zugegebenermaßen 


etwas komplizierte - Formel für den H-Wert:” 


N-I > z (EF ee) j 


lich _ l2n; 
H end —ı LU 
coIT C 22 1-1; Xk-1 


l- N3-N 





(6.62) 


32 1, stellt jeweils die Anzahl der Ränge für die Merkmalsausprägung i dar. Im Beispiel haben wir 
für die Merkmalsausprägung 1 viermal die verbundenen Ränge 2,5, für die Merkmalsausprägung 2 
dreimal die verbundenen Ränge 6, für die Merkmalsausprägung 3 achtmal die verbundenen Ränge 
11,5 und für die Merkmalsausprägung 4 neunmal die verbundenen Ränge 20. 
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Wenden wir diese ‚verrückte‘ Formel auf unser Beispiel an, ergibt sich folgender H-Wert: 








en 252-1 252-1 252 

endlich _ 12:5 Bm) 22 wu I Dr = . 

coIr | u (43—4)+(33—3) +(83—8) +(93—9) ’ 3 X? 
253—25 








(> 13)- E (13,6—13)? ı (88= ) 
(6.63) 


7. Schritt: Testentscheidung 

Ob die Größe des H-Wertes von 7,2 nun signifikant ist, hängt vom gewählten Signifikanz- 
niveau ab. Würde man das Signifikanzniveau bei « = 0,05 festlegen, so ergäbe sich ein 
theoretischer Wert für I von 5,991. Alle Werte, die über dieser Grenze liegen, sind statis- 
tisch signifikant und man würde Ag ablehnen. Der empirisch ermittelte H-Wert liegt mit 
7,2 weit über dieser Grenze, sodass die Nullhypothese mit einer Irrtumswahrscheinlichkeit 
von kleiner als fünf Prozent abgelehnt wird. 

Der entsprechende p-Wert in Abb. 6.39 gibt Auskunft über die genaue Höhe des be- 
gangenen Fehlers: Für das oben beschriebene Verfahren der asymptotischen Signifikanz 
ergibt sich ein Wert von p = 0,027. Der asymptotische H-Test ist allerdings nur dann 
unverzerrt, wenn bei k = 3 Gruppen jede Gruppe mindestens n; > 9 Beobachtungen, bei 
k = 4 Gruppen mindestens n; > 5 Beobachtungen und bei k = 5 Gruppen mindestens 
n; > 3 Beobachtungen enthält. Bei mehr als fünf Gruppen spielt die Anzahl der Beobach- 
tungen pro Gruppe keine Rolle mehr (Bortz, Lienert, Boehnke 2000, S. 225). In unserem 
Beispiel für drei Kundengruppen ist diese Bedingung für die A-Kunden nicht erfüllt, wes- 
halb die Ergebnisse des exakten H-Tests zu interpretieren sind. Bei einem p-Wert von 
p = 0,022 irrt man sıch ın 2,2 Prozent der Fälle, wenn man davon ausgeht, dass sich 
mindestens eine Gruppe von einer anderen unterscheidet. Als Fazit lässt sich ziehen, dass 
sich die durchschnittlichen Ränge der unterschiedlichen Kundengruppen voneinander un- 
terscheiden. Welche Gruppen sich nun genau voneinander unterscheiden, muss wiederum 
durch nachfolgende U-Tests bestimmt werden, wenngleich die durchschnittlichen Ränge 
erste Hinweise darauf geben können, welche Gruppenvergleiche post-hoc herangezogen 
werden sollten. 

Wie der U-Test geht auch der H-Test von annähernd gleichen Verteilungsverläufen in- 
nerhalb der zu vergleichenden Gruppen aus. Ist dies nicht der Fall, so ist der Test nicht 
effizient und entscheidet eher konservativ für die Beibehaltung von 7/9, obwohl Gruppen- 
unterschiede vorliegen. Je stärker die Verteilungsformen der beiden Gruppen voneinander 
abweichen, umso mehr drückt ein signifikantes Testergebnis neben den Unterschieden 
in der zentralen Tendenz auch Unterschiede im Verteilungsverlauf aus. Interessiert also 
nicht ausschließlich die Fragestellung nach Unterschieden bei den Durchschnittsrängen, 
sondern die allgemeine Frage nach generellen Unterschieden zwischen den Gruppen - al- 
so auch hinsichtlich Verteilungsverläufen etc. — kann der H-Test bedenkenlos eingesetzt 
werden. Liegen aber eine normalverteilte Population und Varianzhomogenität vor, ist die 
ANOVA im Vergleich zu einem H-Test das effizientere Verfahren. Aber auch hier gilt: 
Beide Verfahren können als Backup dienen, wenn sie zu ähnlichen Schlussfolgerungen 
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führen. Ist dies nicht der Fall, sollten sich unbedingt Überlegungen über Gründe hierfür 
anschließen. 

An dieser Stelle wollen wir die formale Welt der mathematischen Berechnungen wie- 
der verlassen. Kein Empiriker würde den H-Test heute noch von Hand rechnen, sondern er 
wird dies einer einschlägigen Statistiksoftware überlassen. Einmal von der Last der kom- 
plexen Formel befreit, werden wir sehen, dass die Durchführung und die Interpretation 
des Kruskal-Wallis-Tests (H-Tests) sich als eher einfach herausstellen. 


6.4.2.1 Berechnung des Kruskal-Wallis-H-Tests mit SPSS 

Anhand der Beispieldatei Rang (Flaschendesign).sav wollen wir in SPSS den H-Test 
durch die Befehlsfolge Analyze > Nonparametric Tests — Legacy Dialogs > K In- 
dependent Samples ... °° berechnen. Es öffnet sich das in Abb. 6.40 links dargestellte 
Fenster. Die Gruppierungsvariable — in unserem Fall die Kundenart - ist in das Feld 
Grouping Variable zu verschieben und unter Define Groups ist das Intervall der zu verglei- 
chenden Gruppennummern - in unserem Fall sind das die Gruppen 1 bis 3 — anzugeben. 
Unter Test Variables List erfolgt die Angabe der zu testenden Variable —- in unserem Fall 
ist das die Klasse der Zahlungsbereitschaft. Unter Exact... kann die Berechnung eines 
exakten oder asymptotischen H-Tests angefordert werden. Bei kleinen Stichproben erfolgt 
automatisch die Angabe beider Testergebnisse. 

Bei einem exakten p-Wert von p = 0,022 irrt man sich in 2,2 Prozent der Fälle, wenn 
man davon ausgeht, dass sich mindestens eine Gruppe von einer anderen unterscheidet. 
Als Fazit lässt sich ziehen, dass sich die durchschnittlichen Ränge der unterschiedlichen 
Kundengruppen voneinander unterscheiden. 


6.4.2.2 Berechnung des Kruskal-Wallis-H-Tests mit Stata 
Die Durchführung des Kruskal-Wallis-H-Tests ın Stata auf Basıs der Beispieldatei Rang 
(Flaschendesign).dta erfolgt durch die Befehlsfolge Statistics > Nonparametric analysis 
— Tests of hypotheses > Kruskal-Wallis rank test. Es öffnet sich das in Abb. 6.41 dar- 
gestellte Fenster. Die Gruppierungsvariable - in unserem Fall die Kundenart - ist in das 
Feld Variable definig groups einzutragen. Unter Outcome Variable erfolgt die Angabe der 
zu testenden Variable - in unserem Fall ist das die Klasse der Zahlungsbereitschaft. 
Beim asymptotischen p-Wert von p = 0,0271 irrt man sich in 2,71 Prozent der 
Fälle, wenn man davon ausgeht, dass sich mindestens eine Gruppe von einer anderen 
unterscheidet. Als Fazit lässt sich ziehen, dass sich die durchschnittlichen Ränge der un- 
terschiedlichen Kundengruppen voneinander unterscheiden. Allerdings ıst an dieser Stelle 
zu beachten, dass in unserem Beispiel die Bedingung einer hinreichend großen Stichprobe 
für die A-Kunden nicht erfüllt ist und die Testergebnisse somit verzerrt sein können. 


33 In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Nicht parametrische 
Tests > Alte Dialogfelder > K unabhängige Stichproben ... 
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Durchschnittlicher Rangplatz aller A-Kunden. 





Klasse der A-Kunde 5 19.30 DER etz aller B-Kund 
Ä — 
Zahlungsbereitschaft g_Kunde 11 13.55 
ai Durchschnittlicher Rangplatz aller C-Kunden. 
C-Kunde 9 8.83 
Total 25 


Test Statistics®» 


Klasse Zahlungsbereitschaft Berechneter x°-Wert. 


Chi-Square 7.214 / Freiheitsgrade. 


| 


df 2 -Wert des asymptotischen H-Tests. 
Asymp. Sig. 0.027 p-Wert des exakten H-Tests. 

Exact Sig. .022 

Point Probability .000 

a Kruskal Wallis Test 


b Grouping Variable: Kunde 


Abb. 6.40 Kruskal-Wallis-H-Test mit SPSS 
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Kruskal-Wallis equality-of-populations rank test 


Durchschnittlicher Rangplatz aller A-Kunden. 
kunde | Obs | Rank Sum 
= +- +- FE Durchschnittlicher Rangplatz aller B-Kunden. 

















A-Kunde | 5 | 96.50 
B-Kunde | 11 | 149.00 ee ———nnn [| Durchschnittlicher Rangplatz aller C-Kunden. 
C-Kunde | 9 | 79.50 
22 
chi-squared = 6.609 with 2 d.£. Berechneter X Wert. 
probability = 0.0367 
chi-squared with ties = 7.214 with 2 d.£. 


bability = 0.027 
m Irrtumswahrscheinlichkeit unter Berücksichtigung von 
Rangbindungen. 


Abb. 6.41 Kruskal-Wallis-H-Test mit Stata 
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6.5 Sonstige Testverfahren 


6.5.1 Chi-Quadrat-Unabhängigkeitstest 


Der Chi-Quadrat-Unabhängiskeitstest (engl.: Chi-Square Test of Independence) — der 
verkürzt gerne auch als Unabhängiskeitstest bezeichnet wird — prüft, ob zwei nominale 
Merkmale stochastisch unabhängig sind. Geprüft wird somit die Nullhypothese Ao, dass 
kein Zusammenhang zwischen zwei kategorialen Variablen besteht. Demgegenüber steht 
die Alternativhypothese A}, dass ein Zusammenhang vorliegt. 

Für die Durchführung des Tests erinnern wir uns zunächst an einige Erkenntnisse aus 
der deskriptiven Statistik: Eine übliche Form, den Zusammenhang zweier nominalskalier- 
ter Variablen darzustellen, ist die sogenannte Kreuz- bzw. Kontingenztabelle (engl.: con- 
tingency table oder cross table). In Erweiterung zur univariaten Häufigkeitstabelle enthält 
eine bivariate Kontingenztabelle die Häufigkeit von Ausprägungspaaren. In Abb. 6.42 ist 
eine Kontingenztabelle am Beispiel der Überlebenden der Titanic-Katastrophe in Abhän- 
gigkeit der Buchungsklasse abgebildet. Jedem dürfte die Geschichte der Titanic bekannt 
sein. Eine Geschichte, die immer wieder Grundlage für Kinoverfilmungen war und wohl 
auch zukünftig sein wird, bietet sie doch Stoff aus technischer Arroganz, Fehlverhalten in 
Befehlsstrukturen und sozialer Asymmetrie bei den Opfern. Am 10. April 1912 brach die 
Titanic zu ihrer Jungfernfahrt von Southampton in England nach New York auf. Aufgrund 
ihrer Größe und technischen Ausstattung galt der Riesendampfer als unsinkbar. Am 14. 
April streifte das Schiff jedoch einen Eisberg und sank am Morgen des nächsten Tages 
gegen 2:15 Uhr. Von den 2201 Passagieren überlebten lediglich 710. 

Im Folgenden wollen wir untersuchen, ob der oft unterstellte Zusammenhang, dass vor 
allem die Passagiere der ersten Klasse überlebt haben und die Passagiere der dritten Klas- 
se zu den Opfern zählten, statistisch signifikant ist. Hierzu nutzen wir die Angaben des 
British Board of Trade Inquiry Report (1990). Für jeden Passagier liegen Angaben zum 
Geschlecht (Kind, männlich, weiblich), Angaben über die gebuchte Klasse (1. Klasse, 
2. Klasse, 3. Klasse und Besatzung) sowie Angaben über das Überleben oder Nicht- 
Überleben an Bord der Titanic vor. 

Betrachtet man zunächst in der Kontingenztabelle (vgl. Abb. 6.42) die Struktur der 
Überlebenden aufgegliedert nach der gebuchten Klasse des jeweiligen Passagiers, stellt 
sich die berechtigte Frage, ob alle Passagiere die gleiche Überlebenschance hatten. Wir 
erkennen, dass mehr Passagiere der dritten Klasse (528) als Passagiere der ersten Klasse 
(123) nıcht überlebt haben. Da allerdings auch mehr Passagiere der dritten Klasse an Bord 
des Schiffes waren (706 gegenüber 325), ıst dies zunächst nicht verwunderlich — auch 
dann nicht, wenn alle tatsächlich die gleiche Chance zu überleben gehabt hätten. Betrach- 
tet man nun aber die relativen Häufigkeiten, so haben 32,3 Prozent aller Passagiere das 
Unglück überlebt: Immerhin 62,2 Prozent der Passagiere der ersten und nur 25,2 Prozent 
der Passagiere der dritten Klasse. Tatsächlich ıst die Chance zu überleben von durch- 
schnittlich 32,3 Prozent sehr asymmetrisch verteilt. Je größer diese Asymmetrie, umso 
größer ist letztlich auch der Zusammenhang zwischen gebuchter Klasse und der Tatsache, 
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Ueberlebt * Klasse Crosstabulation 


Ueberlebt Überlebt Count 212 118 178 710 
Expected Count 285,5 1 91,9 221,1 710,0 
% within Ueberlebt 29,9% 28,5% 16,6% 25,1% 100,0% 
% within Klasse 24,0% 62,2% 41,4% 25,2% 32,3% 
% of Total 9,6% 9,2% 5,4% 8,1% 32,3% 
Residual -73,5 97,2 26,1 -49,7 
Std. Residual -4,3 95 2,7 -3,3 
Adjusted Residual -6,8 12,5 33 -4,9 

Nicht überlebt Count 673 123 167 528 1491 
Expected Count 599,5 220,2 193,1 478,3 1491,0 
% within Ueberlebt 45,1% 8,2% 11,2% 35,4% 100,0% 
% within Klasse 76,0% 37,8% 58,6% 74,8% 67,7% 
% of Total 30,6% 5,6% 7,6% 24,0% 67,7% 
Residual 1735 -97,2 -26,1 49,7 
Std. Residual 3,0 -6,5 -1,9 2,3 
Adjusted Residual 6,8 -12,5 -3,5 4,9 
Count 885 325 285 706 2201 
Expected Count 885,0 325,0 285,0 706,0 2201,0 
% within Ueberlebt 40,2% 14,8% 12,9% 32,1% 100,0% 
% within Klasse 100,0% 100,0% 100,0% 100,0% 100,0% 
% of Total 40,2% 14,8% 12,9% 32,1% 100,0% 





Chi-Square Tests Symmetric Measures 


I u Pr 
Asymp. Sig. Value Sig. 
Value (2-sided) 
00 


Nominal by 


Nominal Auen V 
Contingency Coefficient 


N of Valid Cases 


a. Not assuming the null hypothesis. 





Pearson Chi-Square 187,793? ‚0 
Likelihood Ratio 178,414 & ‚000 
Linear-by-Linear 

Association j m 
N of Valid Cases 


a. 0 cells (‚0%) have expected count less than 5. 
The minimum expected count is 91,94. 


b. Using the asymptotic standard error assuming the null 
hypothesis. 


Abb. 6.42 Nominaler Zusammenhang der Überlebenden auf der Titanic 


das Unglück überlebt zu haben. Hätten die Passagiere der ersten Klasse ebenfalls nur eine 
durchschnittliche Chance zu überleben gehabt, dann hätten anstelle der 202 Passagiere 
nur 32,3% - 325 = 105 überlebt. Diese Zahl entspricht der Erwarteten Häufigkeit bei 
Unabhängigkeit. In der dritten Klasse wären anstelle der 528 nur 67,7 % - 706 = 478 Tote 
zu beklagen gewesen. 

Die Differenzen zwischen den erwarteten Häufigkeiten und den tatsächlichen Häufig- 
keiten (engl.: residuals) bieten zwar erste Anhaltspunkte über den Zusammenhang zwi- 
schen den Variablen, diese müssen aber durch Division durch die Wurzel der erwarteten 
Häufiskeiten standardisiert werden (engl.: standardized residuals). Positive Werte für die 
standardisierten Residuen drücken eine überdurchschnittliche (empirische) Häufigkeit im 
Vergleich zur erwarteten Häufigkeit aus, negative Werte den umgekehrten Fall. Es ist zu 
erkennen, dass die Passagiere der ersten Klasse mit 9,5 in der Spalte der Überlebenden 
überdurchschnittlich und die Passagiere der dritten Klasse mit —3,3 unterdurchschnittlich 
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häufig vertreten sind. Die Tatsache, dass fast alle standardisierten Residuen weit von null 
entfernt liegen, weist tendenziell auf einen Zusammenhang hin. 

Durch Quadrierung der standardisierten Werte in jeder Zelle erhält man den jewei- 
ligen Chi-Quadrat-Wert. Die Summe der quadrierten standardisierten Residuen aus den 
einzelnen Zellen ergibt den Gesamt-Chi-Quadrat-Wert. Dieser ıst ein von der gewählten 
Kodierung der beiden Variablen unabhängiger Wert, bei dem sich positive und negative 
Abweichungen nicht aufheben. Nimmt der Gesamt-Chi-Quadrat-Wert den Wert null an, 
besteht zwischen den tatsächlich beobachteten und den erwarteten absoluten Häufigkei- 
ten bei Unabhängigkeit kein Unterschied. Die beiden betrachteten Variablen sind somit 
unabhängig voneinander. Tendenziell gilt, dass mit der Abhängigkeit der betrachteten Va- 
riablen die Größe des Chi-Quadrat-Wertes ansteigt. Leider ist die Stärke der Abhängigkeit 
nicht der einzige Faktor, der die Größe des Chi-Quadrat-Wertes beeinflusst. Tendenziell 
steigt der Chi-Quadrat-Wert auch mit der Größe der Stichprobe und mit der Anzahl der 
Zeilen und Spalten der Kontingenztabelle. Auch ist bei Tabellen mit einer großen Anzahl 
an Zeilen und Spalten eine Einschätzung der Stärke eines Zusammenhanges nicht trivial. 
Je mehr Zeilen und je mehr Spalten eine Kontingenztabelle besitzt, umso komplizierter 
wird es, hieraus Zusammenhänge erkennen zu können. Auch ıst es kaum möglich, die 
Stärke von Zusammenhängen zweier Tabellen miteinander zu vergleichen. 

Diese Tatsachen versucht man bei der Berechnung von auf Chi-Quadrat basierten Zu- 
sammenhangsmaßen und dem Chi-Quadrat-Unabhängiskeitstest zu berücksichtigen. Zur 
Überprüfung stochastischer Unabhängigkeit zweier nominaler Variablen geht man des- 
halb wie folgt vor: 


1. Schritt: Formulierung der Hypothesen 
Die Hypothesen des Chi-Quadrat-Unabhängigkeitstest lauten: 


Ho: Zwischen zwei kategorialen Variablen besteht kein Zusammenhang (Variablen sind 
statistisch/stochastisch unabhängig). 

Hy}: Zwischen zwei kategorialen Variablen besteht ein Zusammenhang (Variablen sind 
statistisch/stochastisch abhängig). 


2. Schritt: Festlegung des Signifikanzniveaus «& 

Im nächsten Schritt erfolgt die Festlegung des Signifikanzniveaus «a, also der maximal 
zulässigen Wahrscheinlichkeit, bei der Ao irrtümlicherweise abgelehnt wird, obwohl die 
Hypothese zutrifft. Die Festlegung der Größe von & obliegt dem Forscher selbst. In der 
Regel wird & bei den Schwellenwerten 1%, 5% oder 10% festgelegt, wobei die 5 %- 
Schwelle die gängigste Größe für & ist. Der maximal zulässige &-Fehler wird an dieser 
Stelle auf & = 0,05 festgelegt. 


3. Schritt: Ziehung der Stichprobe und Prüfung der Annahmevoraussetzungen 
Es muss eine Zufallsstichprobe vorliegen. Dabei ıst darauf zu achten, dass die erwarteten 
Häufigkeiten in jeder Zelle möglichst größer als fünf sind. Dies sollte für mindestens 
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20% der Zellen gelten. Ist letztere Bedingung nicht gegeben, wird von der Berechnung 
des Unabhängiskeitstests abgeraten. Anstelle dessen sollte der Fisher- Yates-Test (1963) 
verwendet werden. 


4. Schritt: Bestimmung des kritischen Testwerts 
Unter den oben genannten Annahmen ist die Testgröße mitv = (m — 1): (q - 1) Frei- 
heitsgraden näherungsweise Chi-Quadrat-verteilt. Die Werte für m und q entsprechen 
dabei der jeweiligen Anzahl der Zeilen und Spalten der Kontingenztabelle. Für das Bei- 
spiel aus Abb. 6.42 ergeben sich aufgrund von zwei Zeilen und vier Spalten insgesamt 
v= (4-1): (2-1) = 3 Freiheitsgrade. Bei einem festgelegten « von 0,05 ist der Chi- 
Quadrat-Tabelle in der Spalte p = (1-«) = 0,95 und in der Zeile für drei Freiheitsgrade 
der kritische Wert von 

N (6.64) 


zu entnehmen. 


5. Schritt: Bestimmung des kritischen Testwerts 

Liegt der empirisch berechnete Wert für Chi-Quadrat über diesem kritischen Wert (co < 
x?), so wird Ho bei einer Irrtumswahrscheinlichkeit von « < 0,05 abgelehnt. Berechnet 
man den Chi-Quadrat-Wert für unser gegebenes Beispiel von Hand, ergibt sich folgendes 


Ergebnis: 
m: 5 (ni; nf)” (212 - 285,5)? (673 — 599,5)? (528 — 478,3)? 
"Tu m 855 599,5 u 478,3 
x 187,8. 
(6.65) 


Die Parameter N; 


figkeiten der einzelnen Zellen der betrachteten Kreuztabelle. 


und n;; entsprechen dabei den erwarteten und den tatsächlichen Häu- 


6. Schritt: Testentscheidung 

Bei diesem Schritt hängt es davon ab, ob die Berechnungen mit Hilfe der traditionellen 
Chi-Quadrat-Tabelle (vgl. Abschn. 8.2) oder mit Hilfe von Ergebnistabellen professio- 
neller Statistikprogramme erzeugt werden. Im letzteren Fall ist lediglich zu überprüfen, 
ob der p-Wert - häufig auch als asymptotische Signifikanz bezeichnet - geringer als der 
unter Schritt 2 festgelegte Wert für & ist (p < «). In diesem Fall wird Al, verworfen 
und eine statistische Abhängigkeit mit einer Irrtumswahrscheinlichkeit von p angenom- 
men. Erfolgt die Berechnung hingegen mit Hilfe der traditionellen Chi-Quadrat-Tabelle 
(vgl. Abschn. 8.2), so ıst zunächst der kritische Wert co für das gegebene Konfidenzniveau 
(1 — «&) und den gegebenen Freiheitsgraden v = (m — 1) : (q — 1) zu bestimmen (siehe 
Schritt 4). Der empirisch berechnete Wert für Chi-Quadrat liegt mit y* = 187,8 eindeutig 
über dem kritischen Wert co = 7,815, sodass A, verworfen wird. 
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An dieser Stelle sei daran erinnert, dass durch den Unabhängiskeitstest der Zusam- 
menhang zwischen den beiden Variablen zwar bestätigt ist. Ob der Zusammenhang auch 
letztlich der vermutete ıst — also in unserem Fall (vgl. Abb. 6.42): Es haben mehr Passa- 
giere der ersten Klasse überlebt und nıcht umgekehrt -, muss letztlich durch Betrachtung 
der (standardisierten) Residuen zwischen tatsächlichen und erwarteten Häufigkeiten nach- 
gewiesen werden. 

Sollte der Unabhängigkeitstest zu dem Ergebnis kommen, dass Fo nicht verworfen 
werden kann — das ist der Fall wenn (co > x’) und (p > «) gilt -, muss die Größe 
der nominalen Zusammenhangsmaße (z.B. Cramers V) als nicht signifikant verschieden 
von Null interpretiert werden. Es kann also nicht von einer stochastischen Abhängigkeit 
ausgegangen werden. 


6.5.1.1 Berechnung des Chi-Quadrat-Unabhängigkeitstests mit SPSS 

Um mit SPSS eine Kreuztabelle nebst dazu gehöriger Berechnung der nominalen Zusam- 
menhangsmaße und des Unabhängiskeitstests zu generieren, muss durch Verwendung der 
Befehlsfolge Analyze > Descriptive Statistics > Crosstabs ... das Crosstabs-Fenster ge- 
öffnet werden.”* In diesem Fenster sind zunächst die beiden Zeilen- und Spaltenvariablen 
auszuwählen, deren Zusammenhang überprüft werden soll. In unserem Beispiel soll die 
Variable Ueberlebt als Zeilenvariable (Row(s)) und die Variable Klasse als Spaltenvariable 
(Column(s)) ausgewählt werden. 

Durch Anklicken des Feldes Cells (Zellen) öffnet sich ein Fenster, in dem die 
gewünschten Berechnungen der Kontingenztabelle ausgewählt werden können (vgl. 
Abb. 6.43 Das Zellen-Fenster). Die Auswahl der zu berechnenden Zusammenhangsmaße 
nebst dem Ergebnis des Unabhängigskeitstests erfolgt über das Feld Statistics ... (vgl. 
Abb. 6.43 Das Statistik-Fenster). Durch Bestätigung des OK-Feldes werden die Tabellen 
in Abb. 6.42 generiert. 

Bestätigt wird der oben bereits festgestellte statistische Zusammenhang mit einer 
asymptotischen Signifikanz von p = 0.000 < 0,05 (vgl. Abb. 6.42). Mit einem Wert für 
Cramers V von 0,292 ist der Zusammenhang mittelstark.” 


6.5.1.2 Berechnung des Chi-Quadrat-Unabhängigkeitstests mit Stata 

Mit Stata lässt sich die Analyse analog durchführen. Durch die Befehlsfolge Statistics 
—Summaries, tables, and tests >Tables >Two-way tables with measures of association 
öffnet sich das folgende Two-way-table-Fenster (vgl. Abb. 6.44). Es müssen ebenfalls die 
beiden zu betrachtenden (Zeilen-/Spalten-) Variablen und die gewünschten Berechnungen 
ausgewählt werden. Auf der linken Seite befinden sich alle Zusammenhangsmaße sowie 
die Berechnung der Chi-Quadrat-Statistik, während auf der rechten Seite die gewünschten 


># In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Deskriptive Statistiken 
— Kreuztabellen ... 

> Eine sehr gute Darstellung über die Vorgehensweise zur Berechnung des Unabhängigkeitstests 
mit SPSS findet sich hier: https://www.youtube.com/watch?v=wflfEWMJY3s. 
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Gibt die Variablen des Datensatzes wieder, 
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Quadrat-Wertes berechnen, wobei das Vorzeichen 
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Abb. 6.43 Nominaler Zusammenhang der Überlebenden auf der Titanic mit SPSS 


Zellenstatistiken der Kontingenztabelle angegeben werden können. Durch Drücken von 
OK bzw. Submit wird der Stata-Befehl”° ausgelöst und die Ergebnisse können — analog 
zum Beispiel mit SPSS - interpretiert werden.”’ 


2 Syntaxbefehl: tabulate class survived, cchi2 cell chi2 clrchi2 column expected row V. 
37 Eine sehr gute Darstellung über die Vorgehensweise zur Berechnung des Unabhängigkeitstests 
mit Stata findet sich hier: https://www.youtube.com/watch?v=GZlIi9zZAlzIA. 


N 
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Abb. 6.44 Nominaler Zusammenhang der Überlebenden auf der Titanic mit Stata 


6.5.1.3 Berechnung des Chi-Quadrat-Unabhängigkeitstests mit Excel 
Die Berechnung von Kreuztabellen sowie die der damit zusammenhängenden Parameter 
wie Chi-Quadrat lassen sich in Excel nur mit einem größeren Aufwand durchführen. Dies 
liegt vor allem daran, dass Kontingenztabellen weder unter Analysefunktionen noch unter 
den allgemeinen Funktionen ausreichend vorprogrammiert sind. Hier zeigt sich im beson- 
deren Maße der Nachteil von Excel im Vergleich zu professionellen Statistikpaketen. 
Dennoch soll das Vorgehen in Excel an dieser Stelle kurz skizziert werden. Zunächst 
müssen die (bedingten) tatsächlichen Häufigkeiten einer jeden Zelle wie ın Abb. 6.45 aus- 
gezählt werden. Hierfür ıst die Anwendung der Pivot-Tabellen-Funktion hilfreich. Mit 
der Befehlsfolge Einfügen und PivorTable wird das Fenster Pivor Tabelle erstellen ge- 
öffnet, in welches unter dem Punkt Tabelle oder Bereich auswählen der Bereich der 
Rohdaten zu markieren ist. Danach sollte durch die Betätigung des OK-Feldes die Pivot- 
Tabelle in ein neues Arbeitsblatt abgelegt werden. Die beiden Variablen (Überlebt und 
Klasse) können danach per „drag and drop“ von der Feldliste auf die Felder Spaltenfel- 
der hierher ziehen bzw. Zeilenfelder hierher ziehen verschoben werden. Es entsteht eine 
Kreuztabelle, bei der zunächst noch die bedingten absoluten Häufiskeiten innerhalb der 
Tabelle fehlen. Diese können nun erzeugt werden, indem eine der beiden Variablen von 
der Feldliste per „drag and drop“ auf das Feld & Werte gezogen wird. In diesem Feld 
ist die Variable anzuklicken, der Menüpunkt Wertfeldeinstellungen ... zu wählen und 
die Option Anzahl als Wertfeldzusammenfassung zu bestätigen. Es entsteht eine Kreuz- 
tabelle mit den tatsächlichen Häufigkeiten. Veränderungen in den Rohdaten führen erst 
dann zu Veränderungen in der Kreuztabelle, wenn sich der Cursor auf einer Zelle der 
Kreuztabelle befindet und die Befehlsfolge PivorTable-Tools > Optionen — Aktualisie- 
ren durchgeführt wird. Die erwarteten Häufigkeiten lassen sıch dann analog der gegebenen 
Formel (Zeilensumme multipliziert mit der Spaltensumme geteilt durch die Gesamtsum- 
me) in Excel programmieren (vgl. 2. Tabelle in Abb. 6.45). In einer weiteren Tabelle 
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A B C D | 

I Tatsächliche Häufigkeit 
2 "Anzahl von Übertebt JÜberlebt 
- 






-SUMME(B4:CA) 









-SUMME(D4:D7) 
=B$8°$D4/5D$8 -SUMME(B13:C13) 
= * 13 Besatzung 
=B$8*$D6/$D$8 er 

un -SUMME(D13:D16) 
-(B4-B13)N2/B13 
=(B6-B15)N2/B15 
-SUMME(B22:C25) 


=(C29/(D8*(MIN(ANZAHL(B22 
:B25); ANZAHL (B22:C22))- 
29 Chi?-Wert | 705 


30 Cramers V 0.292 
31 Asymptotische Sig. 0.00 ————| |-1-CHIQU.VERT(C29;3;1) 


Abb. 6.45 Nominaler Zusammenhang der Überlebenden auf der Titanic mit Excel 


(vgl. 3. Tabelle in Abb. 6.45) lassen sich dann zellenweise die einzelnen Chi-Quadrat- 
Bestandteile berechnen. Aus der Summe dieser Chi-Quadrat-Bestandteile ergibt sich dann 
der Chi-Quadrat-Wert, aus dem schließlich Cramers V sowie der p-Wert des Unabhängig- 
keitstests berechnet werden kann. Beispielhaft sind die einzelnen Berechnungsformeln in 
Abb. 6.45 wiedergegeben.” 


6.5.2 Tests auf Normalverteilung 


Die vorangegangenen Kapitel haben deutlich gemacht, dass viele Test- und Schätzver- 
fahren von der Annahme normalverteilter Variablen ausgehen. Kann die Annahme einer 
Normalverteilung nicht gehalten werden, sind viele der parametrischen Verfahren nur 
noch asymptotisch — also nur bei großen Stichproben - oder gar nicht gültig (vgl. das 
Zentrale Grenzwerttheorem in Abschn. 5.1). 

Der einfachste Weg zur Überprüfung der Normalverteilung ist die Erstellung eines 
Histogramms. Der Forscher hat in Augenscheinnahme der Grafik zu entscheiden, ob die 


38 Eine sehr gute Darstellung über die Vorgehensweise zur Berechnung des Unabhängigkeitstests 
mit Excel findet sich hier: https://www.youtube.com/watch?v=ODxEoDyF6Rl. 
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Daten approximativ einer Normalverteilung folgen oder nicht. Field (2005) kritisiert die in 
dieser Vorgehensweise immanente Subjektivität und Möglichkeit einer missbräuchlichen 
Interpretation (,‚Well, it looked normal to me‘). Dass diese Kritik durchaus berechtigt ist, 
zeigt sich in Abb. 6.46, in der bei identischer Datenlage der gleiche Sachverhalt (Ver- 
teilung des Absatzes eines Produktes) links mit fünf Säulen und rechts mit 25 Säulen 
dargestellt ist. Selbst der ehrlichste Leser wird in beiden Fällen zu unterschiedlichen 
Schlüssen kommen, obwohl es sich um ein und denselben Sachverhalt handelt. 

Zur Überprüfung der Normalverteilungsannahme sollten deshalb objektive Testverfah- 
ren wie der Kolmogorov-Smirnov-Anpassungstest (Kolmogorov 1933; Smirnov 1933), 
der Shapiro-Wilk-Test (Shapiro und Wilk 1965) oder der Shapiro-Francia-Test (Shapiro 
und Francia 1972) Anwendung finden. Mit diesen Verfahren lassen sich folgende Hypo- 
thesen testen: 


Ho: Die zu untersuchenden Werte folgen einer Normalverteilung. 
Hy}: Die zu untersuchende Werte folgen keiner Normalverteilung. 


Der Kolmogorov-Smirnov-Anpassungstest ist eine Testmethode, der keine eigene Ver- 
teilungsannahme unterliegt. Der Test basiert auf der Idee des Vergleichs der maximalen 
absoluten Differenz zwischen einer kumulierten Verteilungsfunktion einer empirischen 
Stichprobe und der kumulierten Verteilungsfunktion einer festgelegten theoretischen Ver- 
teilung. Der Test überprüft also die Güte der Anpassung empirisch ermittelter Beobach- 
tungen an eine gegebene theoretische Verteilung, in diesem Fall an die Normalverteilung. 

Von vielen Statistikern wird der Kolmogorov-Smirnov-Anpassungstest aufgrund sei- 
ner vergleichsweise geringeren Teststärke (engl.: power) nicht als das beste Testverfahren 
zur Überprüfung auf Normalverteilung bewertet. Der Test neigt mehr als andere Verfah- 
ren zur Ablehnung der Normalverteilungsannahme. Zudem werden Abweichungen von 
der Normalverteilung in den äußeren Bereichen der Verteilung nicht ausreichend erkannt, 
weshalb gerne auf den Shapiro-Wilk-Test oder den Shapiro-Francia-Test verwiesen wird. 
Ersterer eignet sich besonders bei Stichproben bis zu n = 2000 Beobachtungen, letzterer 
bei einem größeren Stichprobenumfang. 

Liegt der p-Wert eines Tests unter dem üblich festgelegten Signifikanzniveau von « = 
0,05, so wird die Normalverteilungsannahme (79) verworfen. In seltenen Einzelfällen 
kann die gemeinsame Anwendung der Testverfahren zu unterschiedlichen Entscheidun- 
gen führen. In jedem Fall sollte davon ausgegangen werden, dass keine Normalverteilung 
vorliegt, sobald eines der gezeigten Testverfahren zu signifikanten Ergebnissen (p < 0,05) 
führt. 


6.5.2.1 Berechnung von Tests auf Normalverteilung mit SPSS 

Anhand der uns bereits bekannten Beispieldatei schokopraline_farbe_name_preis.sav 
wollen wir, nach den Verpackungsfarben Blau und Gelb getrennt, die Annahme auf 
Normalverteilung der Absatzzahlen überprüfen. Nach der Befehlsfolge Analyze — 
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#2 Explore Einfügen der gewünschten Testvariable (absatz). 
Dependeri List 
d Name des Prod & # absatz | (Austen 
# schokoir f ie Einfügen der gewünschten nominalen Faktoren (farbe). 
# monchac == Kınıs... 
Factor List 
z ) u Pro | Bootstrap...| 
# geb l _— —— 
SP Preis __ Labellasesby #3 Expiore: Plots Ieeiä] 
en ee: Darstellung der Verteilung der PA Eine a IOgMEBB. | | E3 Sana an aa 
ae ee | Testvariablen durch ein — Bependents toget EL) 
[LOK] Baste | Beset | Cancel) _Hep Histogramm. = 
=’ Noemalty plols with tests 
Berechnung der Tests Kolmogorov- Spread vs Level wih Levene Test 
Smirnov und Shapiro-Wilk. ® None 
:  Porwer estmaion 
Tests of Normality O Transtormed 
Kolmogorov-Smirnov: Shapiro-Wilk SS UREBERHIDER 
a Statistic df Sig. | Statisttic df Si | = 
Produkts & 2 
Absatz blau .118 120 .000 1.944 120 .000 
gelb 157 120 .000 | .9226 120 .000 








a Lilliefors Significance Correction 


Die p-Werte beider Tests sind für beide Farben geringer als a=0,05, 
sodass auf einem Signifikanzniveau von 0=5% die Annahme der 


Normalverteilung verworfen werden muss. 





Abb. 6.47 Test auf Normalverteilung mit SPSS 


Descriptive Statistics — Explore ...”” lässt sich im Dialogfenster unter Dependent 
List die Testvariable (absatz) dıe Testvariable eingeben. Soll die Prüfung nach Gruppen 
getrennt erfolgen, ist unter Factor List eine Gruppierungsvariable (farbe) anzugeben (vgl. 
Abb. 6.47). Unter der Rubrik Plots ... können Histogramme wie in Abb. 6.46 und die 
Tests nach Kolmogorov-Smirnov und Shapiro-Wilk angefordert werden. 

Nach Bestätigung durch OK ergeben sich die Tabellen in Abb. 6.47. Die p-Werte beider 
Tests sind für beide Farben geringer als « = 0,05, sodass auf diesem Signifikanzniveau 


die Annahme der Normalverteilung verworfen werden muss.“ 


6.5.2.2 Berechnung von Tests auf Normalverteilung mit Stata 

Auch hier wollen wir mit der Beispieldatei schokopraline_farbe_name_preis.dta für die 
Verpackungsfarben Blau und Gelb die Annahme auf Normalverteilung der Absatzzahlen 
überprüfen. Die grafische Analyse mit Hilfe von Histogrammen der blauen (= 1) und 
gelben (= 2) Verpackungsfarbe erfolgt durch Eingabe der folgenden Befehle in die Stata 
Kommandozeile: 


>? In der deutschsprachigen SPSS Version ist die Befehlsfolge Analysieren > Deskriptive Statistiken 
— Explorative Datenanalyse... 

“ Sehr gute Darstellungen über Tests auf Normalverteilung mit SPSS finden sich hier: https:// 
www.youtube.com/watch?v=dK-JNR3g_LU und hier: https://www.youtube.com/watch?v=sQkB- 
AlJgPI. 
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e histogram absatz if farbe==1, normal 
e histogram absatz if farbe==2, normal 


Für die Tests nach Shapiro-Wilk und Shapiro-Francia sind folgende Befehle einzugeben: 


e swilk absatz if farbe==1 oder sfrancia absatz if farbe==1 
e swilk absatz if farbe==2 oder sfrancia absatz if farbe== 


Die Berechnung des Kolmogorov-Smirnov-Tests gestaltet sich etwas aufwändiger. Zu- 
nächst muss der Mittelwert und die Standardabweichung des Absatzes jeder Farbe durch 
Eingabe des Befehls by farbe, sort: summarize absatz berechnet werden. Danach ist zur 
Überprüfung auf Normalverteilung der Befehl 


e ksmirnov testvar = normal((testvar-mean(testvar))/standardabw(testvar)) 


zu verwenden. Für die blauen und gelben Verpackungsfarben ergeben sich somit die Be- 
fehle 


e ksmirnov absatz = normal((absatz-9982.367)/385.1468) if farbe==1 
e ksmirnov absatz = normal((absatz-9606.067)/490.2867) if farbe== 


Die Tests nach Shapiro-Wilk und Shapiro-Francia ergeben in allen Fällen p-Werte kleiner 
als x = 0,05, sodass nicht von einer Normalverteilung ausgegangen werden kann. 
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Aufgabe 36 
In einem Gerichtssaal erwartet ein Angeklagter sein Urteil. Das Gericht muss über „schul- 
dig‘ oder „nicht schuldig‘ entscheiden. 


a. Welche beiden Fehler können die Richter bei ihrer Entscheidung machen? 

b. In der Rechtsprechung gibt es den Grundsatz: „Im Zweifel für den Angeklagten“. Wie 
müssten die Hypothesen aussehen, wenn von obigem Grundsatz ausgegangen wird? 
Vergleichen Sie die Situation mit einem statistischen Test! 

c. Beschreiben Sie stichpunktartig das Vorgehen bei einem statistischen Test! 


Aufgabe 37 

Geben Sie für untenstehende Beispiele zu den relevanten Variablen das Skalenniveau und 
ein geeignetes Testverfahren an! Sind die jeweiligen Stichproben abhängig oder unab- 
hängig‘? Ist kein Skalenniveau angegeben, ıst das jeweils höchst mögliche Skalenniveau 
anzunehmen. 
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a. Unterscheiden sich Männer und Frauen hinsichtlich des verfügbaren Einkommens’? 
Die Stichprobegröße istn = 1000. 

b. 20 Männer und Frauen geben auf einer Skala zwischen I und 5 an, wie ihnen ein 
bestimmtes Produktdesign gefällt. Ist die Bewertung geschlechtsspezifisch? 

c. 20 Personen geben vor und nach einer Produktpräsentation ihre Meinung zu einem 
Produkt auf einer Skala zwischen 1 und 5 ab. Hat sich die Meinung durch die Produkt- 
präsentation verändert? 

d. Unterscheiden sich drei Studiengänge hinsichtlich ihrer Anteile für männliche und 
weibliche Studierende? 

e. Unterscheiden sıch Käufer und Nichtkäufer eines Produktes hinsichtlich ihres Alters? 
Der Mittelwert des Alters wird als approximativ normalverteilt angenommen. 

f. Unterscheiden sich zwei Fahrzeugtypen (z.B. Golf und Astra) hinsichtlich einer Son- 
derausstattung’” 

g. Vor und nach einer Werbemaßnahme wird die Meinung zu einem Produkt auf einer 
Skala zwischen 1 und 5 erfragt. Hat sich die Meinung durch die Werbemaßnahme 
verändert’? 

h. Sie sollen herausfinden, ob sich die Einstellung zu Holzspielzeug von Eltern mit Söh- 
nen von der Einstellung von Eltern mit Töchtern unterscheidet. Eltern, die sowohl 
Söhne als auch Töchter haben, werden zunächst nicht betrachtet. Die Einstellung wird 
auf einer 5-stufigen Skala (1 = „Holzspielzeug finde ich gar nicht gut“ bis 5 = ‚„Holz- 
spielzeug finde ich sehr gut‘) gemessen. 

1. Welches Verfahren wenden Sie an, wenn auch die Gruppe der Eltern mit Söhnen und 
Töchtern in den Vergleich mit einbezogen werden? 


Aufgabe 38 

Bei einer Befragung von 1000 Käufern eines neuen Kfzs werden die in folgender Abbil- 
dung dargestellten Fragen ın einem Fragebogen gestellt. Geben Sie für die untenstehenden 
Analyse-Beispiele zu den relevanten Variablen das Skalenniveau und ein geeignetes Test- 
verfahren an! Sind die jeweiligen Stichproben abhängig oder unabhängig’ 


Fragebogen 
1. Geben Sie bitte die Postleitzahl der Stadt an, in der Sie wohnen: 
2. Wie ist Ihr erster Eindruck von Ihrem neuen KFZ? 


sehr zufrieden zufrieden unzufrieden 


a) Gesamteindruck D D I 
b) Äußere Form u I u 
c) Innenraum [1 U u 
d) Qualitätseindruck D D I 


3. Mein vorheriges Fahrzeug habe ich Jahre gefahren. 
4. Mein KFZ ist ein: D Privatfahrzeug OD Firmenfahrzeug 


5. Wieviele KFZ gleicher Marke haben Sie früher besessen? KFZ 
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a. Unterscheiden sich Privat- und Firmenfahrzeugbesitzer hinsichtlich ihres Wohnortes? 

b. Unterscheiden sich Privat- und Firmenfahrzeugbesitzer hinsichtlich ihres Eindrucks 
von der Qualität ihres neuen Kfzs? 

c. Weicht die mittlere Fahrdauer des zuletzt gefahrenen Kfzs von 5 Jahren ab’ 

d. Unterscheiden sıch Privat- und Firmenfahrzeugbesitzer hinsichtlich der Anzahl der bis- 
her besessenen Kfzs gleicher Marke? 

e. Unterscheidet sich die Zufriedenheit der Kunden mit dem Gesamteindruck des neuen 
Kfzs von der Zufriedenheit mit dem Innenraum des Kfzs? 


Aufgabe 39 

Pro Tag besuchen mehr als 10.000 Kunden Ihre Geschäfte. Eine Stichprobe im Umfang 
von n = 100 Kunden aus Geschäft A ergibt eine durchschnittliche Verweildauer von 45 
Minuten. Die tatsächliche Verweildauer seı normalverteilt mit unbekanntem Mittelwert u 
und einer theoretischen Varianz von 0° = 15° Minuten“. Laut Geschäftsleitung beträgt die 
mittlere Verweildauer 55 Minuten. Testen Sie, ob auf Basis der Stichprobe diese Aussage 
mit einer maximalen Irrtumswahrscheinlichkeit von & = 0,05 verworfen werden kann 
und begründen Sie! 


Aufgabe 40 

Die Geschäftsleitung aus Aufgabe 31 verlangt von Ihnen, auszuliefernde Ware vor der 
Auslieferung mit einer maximalen Irrtumswahrscheinlichkeit von 20 Prozent hinsichtlich 
der vom Kunden gewünschten Mindestlänge von 150cm zu überprüfen. Nachdem Sie 
die Maschine neu justiert haben, ziehen Sie erneut eine Stichprobe von 120 Bändern und 
erhalten eine durchschnittliche Länge von 150,1cm bei einer empirischen Varianz von 
52, = 3° cm“. Die Länge der Bänder in der Grundgesamtheit sei auch hier normalver- 


emp 


teilt. 


a. Formulieren Sie auf das Beispiel bezogen die Hypothesen des Testes, sodass der «@- 
Fehler den „schwerwiegendsten Fehler“ bezeichnet! 

b. Überprüfen Sıe, ob unter diesen Umständen die Annahme der Mindestlänge von 
150 cm beibehalten werden kann! 

c. Bestimmen Sie den p-Wert aus Aufgabenteil b.! 


Aufgabe 41 

Die Geschäftsleitung verlangt von Ihnen, mit 99-prozentiger Sicherheit sagen zu Können, 
dass die Umstellung von gelber auf blaue Verpackung zu besseren Absatzzahlen führt, 
als die Belassung bei gelber Verpackung. Die gelbe Verpackung hatte im Durchschnitt 
zu einem wöchentlichen Absatz von 10.000 Packungen geführt. Die Stichprobe in 100 
der 5500 Leckermärkten ergab für die blaue Verpackung einen Wochenabsatz von 10.050 
Packungen bei einer empirischen Standardabweichung von 360 Packungen. 


a. Formulieren Sie auf das Beispiel bezogen die Hypothesen des Testes, sodass der «@- 
Fehler den „schwerwiegendsten Fehler“ bezeichnet! 
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Ränge Statistik für Test *b 


itlerer Rang 


Bewertung \Wurfsendung 38,00 


[Bewertung 


Lokalanzeiger 10,10 
Plakat 20,90 





Chi-Quadrat 35,057 
df 2 
Asymptotische Signifikanz ‚000 


Gesamt a. Kruskal-Wallis-Test 


b. Gruppenvariable: Werbeart 





Abb. 6.48 Wirkung von drei Werbemaßnahmen 


b. Formulieren Sie den entsprechenden $-Fehler! 

c. Testen Sıe, ob unter diesen Umständen die Forderung der Unternehmensführung erfüllt 
ist! 

d. Wie groß muss die Stichprobe - ceteris paribus — gewählt werden, damit die Untergren- 
ze eines einseitigen Konfidenzintervalls (x = 5%) bei mindestens 9950 Packungen 
liegt‘? 


Aufgabe 42 

Sıe werden mit einer Wettbewerbsanalyse für Babynahrung betraut. Hierzu befragen Sie 
120 Eltern auf zwei 5-stufigen Skalen, inwieweit sie die Produkte von hupp und Malipa 
als naturbelassen empfinden. 


a. Welche Verfahren lassen sich anwenden’? 

b. Im Rahmen der Untersuchung sollen Sie außerdem untersuchen, ob ein neues Produkt 
„Baby Karotte“ oder „Baby Möhre“ heißen soll. Sie befragen die gleichen 120 Eltern: 
60 Eltern sollen auf einer 5-stufigen Noten-Skala den Namen „Baby Karotte“, die wei- 
teren 60 Eltern auf einer analogen Skala den Namen „Baby Möhre“ bewerten. Welches 
Verfahren wenden Sie an? 


Aufgabe 43 

Im Rahmen einer Studie untersuchen Sie die Wirkung von drei unterschiedlichen Wer- 
bemaßnahmen (Wurfsendung, Anzeige in der Lokalzeitung und Werbeplakat) auf die 
Kundenpräferenz für ein bestimmtes Produkt. Die Kundenpräferenz wird auf einer zehn- 
stufigen Skala (1 = ‚würde ich sofort kaufen“ bis 10 = „würde ich bestimmt nicht 
kaufen“) gemessen. Es ergeben sich die in Abb. 6.48 dargestellten Ergebnisse. 


a. Interpretieren Sie die Ergebnisse! Gehen Sie dabei auch auf die Frage ein, für welche 
Werbeart Sie sich entscheiden würden. 

b. Skizzieren Sie kurz, wie die mittleren Ränge in Abb. 6.48 bestimmt werden! 

c. Sıe untersuchen nun in einer anderen Studie die Wirkungen der Werbemaßnahmen 
„Lokalanzeiger“ und „Plakatwerbung‘ auf die Wahrnehmung der Produktqualität. Es 
ergeben sich die Analyseergebnisse in Abb. 6.49. Interpretieren Sie die Ergebnisse! 
Wie groß ist die einseitige asymptotische Signifikanz? 
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Ränge 


Mittlerer Rang 


Wahrnehmung der Lokalanzeiger 10 13,65 136,50 
Produktqualität Plakat 15 12,57 188,50 
Gesamt 25 


| Wahmehmung der Produktqualität 


Mann-Whitney-U 68,500 

Wilcoxon-W 188,500 

Z -,380 

Asymptotische Signifikanz (2-seitig) ‚704 

Exakte Signifikanz [2*(1-seitig Sig. )] 123° 
a. Nicht für Bindungen korrigiert. 





b. Gruppenvariable: Werbeart 


Abb. 6.49 Wirkung von zwei Werbemaßnahmen 


Aufgabe 44 

Sıe erhalten die in Abb. 6.50 dargestellten Ergebnisse einer Studie über die getätigten 
Jahresumsätzen verschiedener Haushaltstypen in einer Supermarktkette. Was wurde in- 
haltlich untersucht und wie sind die Ergebnisse zu interpretieren’? 


Aufgabe 45 
Sıe haben von Käufern zweier Kraftfahrzeugmarken die Stärke des Motors in klassierter 


Form erhoben. Es entsteht die Kontingenztabelle in Abb. 6.51. 


a. Ergänzen Sie die erwarteten Häufigkeiten bei Unabhängigkeit! 

b. Wie viel Prozent der Käufer der Marke 1 haben ein Fahrzeug mit zwischen 76 und 100 
PS gekauft? 

c. Wie viel Prozent der gekauften Fahrzeuge mit einer Motorenleistung zwischen 5] und 
75PS sınd von der Kfz-Marke 2? 


Group Statistics 


Std. Std. Error 
Haushaltstyp N Mean Deviation Mean 





Jahresumsatz | Typ1 178 772.7131 | 15.87738 1.19006 
778.2458 | 29.90867 2.20490 


Independent Samples Test 


Levene's Test for 
Equality of Variances t-test for Equality of Means 
95% Confidence Interval of 
Sig. Mean Std. Error the Difference 
F Sig. t df 2-tailed) |Difference | Difference Upper 


Equal variances assumed | 81.231 0.000 -2.188 0.029 -5.53277 | 2.52900 | -10.50623 -0.55930 
Equal variances not assumed ze -2.208 | 280.54 0.028 -5.53277 | 2.50556 |-10.46485 |  -0.60069 





Abb. 6.50 Ergebnisse einer Marktforschungsstudie 
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BD a a | | ee Teen 
100 55 5 0 

KFZ-Marke 1 

En a Er Er 


0 30 5 5 
BGE BE BEPEEEE BEP FE FE BE 
| | 


Abb. 6.51 Käufer von Kfz-Marken 





d. Skizzieren Sie stichwortartig die Vorgehensweise beim Chi-Quadrat-Unabhängiskeits- 
test! 

e. Bestimmen Sie den Chi-Quadrat-Wert, sodass der Chi-Quadrat-Unabhängiskeitstest 
nicht verzerrt! Kann auf Basis dieses Chi-Quadrat-Wertes bei einem Signifikanzniveau 
vona = 1% auf einen Zusammenhang zwischen gekaufter Kfz-Marke und Motoren- 
stärke geschlossen werden’? 

f. Angenommen, Sie hätten die Stichprobe des obigen Beispiels so erhöht, dass keine 
Zeilen oder Spalten aggregiert werden müssen. Für Chi-Quadrat ergibt sich nun ein 
Wert von nur 7,128. Kann auf Basis dieses Chi-Quadrat-Wertes bei einem Signifikanz- 
niveau von « = 1% auf einen Zusammenhang zwischen gekaufter Kfz-Marke und 
Motorenstärke geschlossen werden? 


Aufgabe 46 

In einem Experiment zur Wirkung von Musik auf die Ausgabebereitschaft beim Einkauf 
in einem Supermarkt wurden 400 Kunden zufällig ausgewählt. Ein Teil der Kunden tätigte 
seine Einkäufe an Tagen, an denen im Supermarkt keine „Hintergrundmusik“ eingespielt 
wurde. Der andere Teil der Kunden tätigte den Einkauf an einem Tag, an dem der Einkauf 
durch Musik und Werbeansagen begleitet wurde. Jeder Kunde wurde hinsichtlich der Ge- 
samtsumme der getätigten Einkäufe in eine der drei Gruppen, hohe, mittlere und geringe 
Ausgabebereitschaft eingruppiert (vgl. Abb. 6.52). 


Hohe Mittlere Geringe 
a no nn Summe (x) 
Mit Musik | Anzahl 130 
(x=1) (Erw. Häufigkeit) (89,25) > = en 5 


Ohne Musik | Anzahl 40 20 130 190 
(x=2) (Erw. Häufigkeit) (80,75) (23,75) (85,50) 


Abb. 6.52 Musikwirkung 
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1 Person | 2 Personen 
oe Summe (x) 
(y=1) (y=2) 
£77 =3) 
(x=1) 
1 Banane (x=2) N (10,25) | 87 (92,25) 
(102,5) 


® 
TEEN 


Summe 0 tes iste mi 





Abb. 6.53 Bananen 


a. Bestimmen Sie den Chi-Quadrat-Wert, sodass der Chi-Quadrat-Unabhängiskeitstest 
nicht verzerrt! 

b. Kann aus den Daten bei einem Signifikanzniveau von a = 5% auf einen Zusam- 
menhang zwischen Musikeinspielung und Gesamtsumme des Einkaufs geschlossen 
werden’? 

Aufgabe 47 


Sie haben von Käufern in einem Lebensmittelhandel die Haushaltgröße des Kunden sowie 


die Anzahl der gekauften Bananen in der Kontingenztabelle der Abb. 6.53 ermittelt. 


Bestimmen Sie den Chi-Quadrat-Wert, sodass der Chi-Quadrat-Unabhängiskeitstest 
nicht verzerrt! 

Kann aus den Daten bei einem Signifikanzniveau von « = 5% auf einen Zusammen- 
hang zwischen Haushaltsgröße und Bananenkauf geschlossen werden’? 


Aufgabe 48 

In einer Studie wird die Präferenz für ein Produkt (How would you rate this product?) und 
die Einstellung zum Preis des Produktes (It is a fair price) erhoben. Es ergibt sich die in 
Abb. 6.54 dargestellte Kreuztabelle. 


a. 


b. 


Wie viel Prozent der Befragten mit der Produktbewertung „poor“ geben bei der Aus- 
sage It is a fair price die Antwort strongly disagree‘) 

Ist der Zusammenhang signifikant? Bewerten Sie dabei die Eignung der Koeffizienten 
Phi, Cramers V, Kontingenzkoeffizient und Kendalls Tau zur Lösung dieser Fragestel- 
lung! 

Nach einer Produktpräsentation werden die gleichen Probanden nach ihrer Einstellung 
zum Preis des Produktes (After product presentation: It is a fair price) auf einer Skala 
von 1 (strongly agree) bis 4 (strongly disagree) befragt und ein Test durchgeführt. 
Interpretieren Sie dıe Ergebnisse aus Abb. 6.55! 
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Ranks Test Statistics® 
I 1 _Tneankank [SumorRanks Ater producı 
After product Negative Ranks 83,09 13212,00 nn 
oo tisafairprice Positive Ranks 80,50 483,00 pri -tis a 
Ties Z -11,770°? 
Total Asymp. Sig. (2-tailed) ‚000 
a. After product presentation: Itis a fair price < Itis a fair price a. Based on positive ranks. 
b. After product presentation: Itis a fair price > Itis a fair price b. Wilcoxon Signed Ranks Test 


c. After product presentation: Itis a fair price = Itis a fair price 


Abb. 6.55 Preispräferenz I 


d. Der gleiche Sachverhalt wird mit einer anderen Prozedur nochmals überprüft. Inter- 
pretieren Sıe die Ergebnisse aus Abb. 6.56! Welches nicht-parametrische Verfahren 
können Sie anwenden, um den gleichen Sachverhalt zu untersuchen? 


Aufgabe 49 
Was wurde bei der in Abb. 6.57 dargestellten Prozedur getestet? Interpretieren Sie das 
Ergebnis! 


Aufgabe 50 

Als Manager/in eines Konsumgüterproduktes möchten Sie mit Hilfe einer Fernsehwer- 
bung eine möglichst große Anzahl von Personen ihrer Zielgruppe erreichen. Mit Hilfe 
einer Stichprobe ermitteln Sie für vier verschiedene Sender zu jeweils drei verschiedenen 
Sendezeiten (Time-Slots: 17.00-17.59 Uhr; 18.00-18.59 Uhr; 19.00-19.59 Uhr) die An- 
zahl der erreichten Haushalte (n) sowie die durchschnittliche Anzahl der pro Time-Slot 
und Sender erreichten Personen der Zielgruppe (Mittelwert). Die Ergebnisse finden sich 
in der Datei Werbekontakte.sav bzw. Werbekontakte.dta. 


a. Sind die Voraussetzungen der mehrfaktoriellen Varianzanalyse erfüllt? Was müssten 
Sıe tun, wenn diese Voraussetzungen nicht erfüllt wären? 

b. Welche signifikanten Subgruppen entstehen für die Variable Fernsehsender? 

c. Unterscheiden sich die Time-Slots voneinander”? Begründen Sie Ihre Aussagen! 

d. Erklären Sie inhaltlich und anhand der Randhäufiskeiten, warum der Interaktionseffekt 
zustande kommt! 

e. Sıe haben nun Angebote von der ARD für Time-Slot 19.00-19.59 Uhr und vom ZDF 
für Time-Slot 18.00-18.59 Uhr eingeholt. Das ZDF ist dabei etwas kostengünstiger. 
Welches Entscheidungsproblem haben Sie nun und welches Verfahren müssten Sie 
ggfs. noch anwenden, um eine rationale Entscheidung treffen zu können? Begründen 
Sie Ihre Aussagen! 


Aufgabe 51 
Sıe sind Manager/in einer internationalen Kette von Baumärkten in Deutschland, Frank- 
reich, Spanien und dem Vereinigten Königreich. Nachdem bisher jeder nationale Baumarkt 
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One-Sample Statistics 


N Mean Std. Deviation Mean 





One-Sample Test 
95% Confidence Interval ofthe 
Difference 


Test Value = 54 


Lower Upper 


oe 2a ol oa] mo] ‚zor2] as 


Abb. 6.57 Einstichproben-i-Test 





sein eigenes Markenlabel hatte, wollen Sie nun eine einheitliche Außendarstellung 
(Corporate Identity) definieren. Hierzu führen Sie eine Marktstudie durch, in der die 
Farbwirkung des Baumarktlabels auf die durchschnittliche Anzahl der Besucher pro 
Stunde untersucht wird (s. Datei Baumarkt.sav bzw. Baumarkt.dta). 


a. Welche Farbe würden Sie vorziehen’? 

b. Zwischen welchen Ländern unterscheiden sich die durchschnittlichen Besucherzah- 
len? Verwenden Sie hierzu die Ergebnisse des Scheffe-Tests! 

c. Erklären Sie inhaltlich und anhand der Randhäufiskeiten, warum der Interaktionseffekt 
zustande kommt! 

d. Sind die Voraussetzungen der mehrfaktoriellen Varianzanalyse erfüllt? 


Aufgabe 52 

Der international agierende Nougatcreme-Hersteller Schnutella ıst auf der Suche nach 
einem neuen Werbeträger und einer neuen Werbebotschaft. Aufgrund der Fußball-EM 
sind der Torhüter Oliver Wahn, der eiskalte Torjäger Frigo und das Mittelfeldgenie Zi- 
nedine in der Diskussion. Die Werbeagentur Nullhirn&Partner hat sich hierzu drei neue 
Werbebotschaften (messages) ausgedacht, nämlich Schnutella: Schokolade mit Disziplin, 
Schnutella: Chocolat, ohlala und Schnutella: Connecting Chocolate. Im Rahmen von 500 
europäischen Testmärkten wird der Einfluss der Werbeträger in verschiedenen Kombina- 
tionen mit den drei Werbebotschaften auf den Absatz überprüft (s. Schnutella.sav bzw. 
Schnutella.dta). 


a. Welchen Werbeträger würden Sie aufgrund einer einfaktoriellen ANOVA auf Basis des 
Scheffe-Tests vorziehen? 

b. Welche Werbebotschaft würden Sie aufgrund einer einfaktoriellen ANOVA auf Basis 
des Scheffe-Tests vorziehen? 

c. Sie werden vom Management gebeten, Vorschläge für den neuen Werbeträger und die 
neue Werbebotschaft zu unterbreiten. Interpretieren Sie bitte kurz die Ergebnisse der 
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mehrfaktoriellen Varianzanalyse! Gehen Sie dabei auf Voraussetzungen der Varianz- 
analyse, die Bedeutung jeder Variablen für den Absatz und mögliche Widersprüche zu 
Aussagen in vorherigen Aufgabenteilen ein! Beschreiben Sie bitte außerdem, welche 
Frage durch die obige Varianzanalyse nicht eindeutig beantwortet werden kann! 


6.7 Lösungen der Übungsaufgaben 
Lösung 36 


a. 1. Fehler: Angeklagter wird verurteilt, obwohl er unschuldig ist. 2. Fehler: Angeklagter 
wird nicht verurteilt, obwohl er schuldig ist. 

b. Entsprechend dem Grundsatz „Im Zweifel für den Angeklagten“ ıst sicherzustellen, 
dass die Wahrscheinlichkeit für eine fälschliche Verurteilung möglichst gering ist. Zu 
beweisen ist, dass der Angeklagte schuldig ist. Das führt zu: 

Ho: Angeklagter unschuldig 

Hy: Angeklagter schuldig. 

Fehler erster Art: Angeklagter unschuldig und verurteilt 
Fehler zweiter Art: Angeklagter schuldig und nicht verurteilt 


„Schlimmster Fehler“ ist der Fehler erster Art: « = P(H}| Ho richtig). In statistischen 

Tests wird versucht, die Wahrscheinlichkeit für diesen Fehler möglichst gering zu hal- 

ten. 

c. 1. Aufstellung der Hypothesen. 

2. Bestimmung der Verteilung der Prüfgröße unter Annahme der Gültigkeit der Null- 
hypothese. 

3. Bestimmung des Annahme-/Ablehnungsbereiches. 

4. Bestimmung des Wertes der Prüfgröße in der Stichprobe. 

5. Entscheidung: Fällt der Wert aus der Stichprobe in den Ablehnungsbereich, wird 
die Nullhypothese abgelehnt. Andernfalls wird die Nullhypothese nicht abgelehnt. 
„Schlimmster Fehler“ ist der Fehler erster Art: « = P(H}|Hho richtig) 


Lösung 37 


a. Geschlecht: nominal (dichotome Gruppierungsvariable); Einkommen: metrisch (Test- 
variable); aufgrund der hinreichend großen Stichprobe ist der Mittelwert approximativ 
normalverteilt; Anwendung des 7-Tests für zwei unabhängige Stichproben. 

b. Geschlecht: nominal (dichotome Gruppierungsvariable); Produktbewertung: ordinal 
(Testvariable); zwei unabhängige Stichproben; Anwendung des Mann-Whitney-U- 
Tests. 
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c. Einstellung zum Produkt vorher: ordinal; Einstellung zum Produkt nachher: ordinal; 
abhängige Stichprobe; Stichprobe erlaubt es nicht, von einer approximativen Normal- 
verteilung der Mittelwerte auszugehen; Anwendung des Wilcoxon-Vorzeichen-Rang- 
Tests. 

d. Geschlecht: nominal; Studiengangszugehörigkeit: nominal; Anwendung des Chi- 
Quadrat-Unabhängiskeitstests. 

e. Käufer und Nichtkäufer: nominal (dichotome Gruppierungsvariable); Alter: metrisch 
(Testvariable); unabhängige Stichprobe; aufgrund der approximativen Normalvertei- 
lung der Mittelwerte kann der 1-Test für zwei unabhängige Stichproben angewendet 
werden. 

f. Zwei Kfz-Typen: nominal; Ausstattungsmerkmal: nominal; Anwendung des Chi- 
Quadrat-Unabhängiskeitstests. 

g. Bewertung vor Werbemaßnahme: ordinal; Bewertung nach Werbemaßnahme: ordinal; 
abhängige Stichprobe; Anwendung des Wilcoxon-Vorzeichen-Rang-Tests. 

h. Eltern (nur Söhne; nur Töchter): nominal (dichotome Gruppierungsvariable); Bewer- 
tung von Holzspielzeug: ordinal (Testvariable); zwei unabhängige Stichproben; An- 
wendung des Mann-Whitney-U-Tests. 

ı. Eltern: nominal (Gruppierungsvariable); Bewertung von Holzspielzeug: ordinal (Test- 
variable); drei unabhängige Stichproben; Anwendung des Kruskal-Wallis H-Tests. 


Lösung 38 


a. Privat- und Firmenfahrzeugbesitzer: nominal; Wohnort: nominal; Anwendung des Chi- 
Quadrat-Unabhängiskeitstests. 

b. Privat- und Fiırmenfahrzeugbesitzer: nominal (dichotome Gruppierungsvariable); Qua- 

litätseindruck: ordinal (Testvariable); zwei unabhängige Stichproben; Anwendung des 

Mann-Whitney-U-Tests. 

Mittlere Fahrtdauer: metrisch; Anwendung des Einstichproben-7-Tests. 

d. Privat- und Firmenfahrzeugbesitzer: nominal (dichotome Gruppierungsvariable); An- 
zahl der Kfz gleicher Marke: metrisch (Testvariable); unabhängige Stichprobe; auf- 
grund der approximativen Normalverteilung der Mittelwerte (n = 1000) kann der 


® 


t-Test für zwei unabhängige Stichproben angewendet werden. 
e. Zufriedenheit Gesamteindruck: ordinal; Zufriedenheit Innenraum: ordinal; abhängige 
Stichprobe; Anwendung des Wilcoxon-Vorzeichen-Rang-Tests. 


Lösung 39 

Es soll überprüft werden, ob die Verweildauer 55 Minuten entspricht. Ao: u = 55; MA: 
u # 55. Aus den empirischen Daten ergibt sich: x = 45. Bei bekannter Varianz der 
Grundgesamtheit und nicht benötigtem Korrekturterm ergibt sich folgender Annahmebe- 
reich für Mo: 


m - 21-405; 40 + 21-g0:| — [55-1,96-1,5;55+1,96-1,5] = [52,06:; 57,94]. (6.66) 
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Ho wird nicht beibehalten, da der empirische Mittelwert x = 45 nicht in diesen An- 
nahmebereich fällt. Mit einer maximalen Irrtumswahrscheinlichkeit von weniger als fünf 
Prozent kann behauptet werden, dass die mittlere Verweildauer ungleich 55 Minuten ist. 


Lösung 40 


a. Die Geschäftsführung will beweisen, dass die Länge der Bänder durchschnittlich min- 
destens 150 cm ist: Ao: u < 150; Aı: a > 150. Der „schwerwiegendste“ Fehler 
aus Sicht der Geschäftsführung wäre somit die Entscheidung, eine nur scheinbar die 
Mindestbedingung erfüllende Lieferung zu versenden. 

b. Bei unbekannter Varianz der Grundgesamtheit und nicht benötigtem Korrekturterm 
(n > 30) ergibt sich bei einer Stichprobengröße von 120 folgender Annahmebereich 
für Ao: 


Sem 
[-00; uo + Z1-a0x| = [= Ko-+ | —= [-00; 150 + 0,842 - 0,275] 


— [--00:; 150,23]. 
(6.67) 


Ho wird beibehalten, da der empirische Mittelwert x = 150,1 ın diesen Annahmebereich 
fällt. Die Annahme der Geschäftsleitung, dass die Mindestlänge der Bänder im Durch- 
schnitt größer als 150 cm ist, kann nicht bewiesen werden. 


c. Die Differenz zwischen empirischem Mittelwert und dem Hypothesenwert beträgt 
150,1- 150 = 0,1 





150,1 = +2 —=150-+2 2 => I AB (6.68) 
s PEN —— —— ee - —— . 
Ho 1 Fe 1 730-1 1 3 1-o 
=> 0,36 = Z1-a => & (0,36) =1-«a — u) (0,36) (6.69) 


Da der Wert für ®(0,36) nicht direkt aus einer einseitigen Tabelle der Normalverteilung 
entnommen werden kann, erfolgt eine Umformung in: ®(0,36) = 1 — (0,64), was — 
zufälligerweise auch — einem Wert von 0,36 entspricht. Die Irrtumswahrscheinlichkeit ist 
somit: 

> a&=1-(1- 9(0,64)) = 1 - (1 - 0,36) = 0,36. (6.70) 


Lösung 41 


a. Die Geschäftsleitung wird den Kosten eines Umstiegs auf die Farbe Blau nur dann 
zustimmen, wenn dies ım Vergleich zur gelben Verpackung nicht zu niedrigeren Ab- 
satzzahlen führt. Zu testen wäre entsprechend: 


Ho: Yblau < 10.000 versus Ah: Hptau > 10.000. (6.71) 
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Die Geschäftsführung will beweisen, dass die blaue Verpackung bessere Ergebnisse er- 
zielt. Aus dieser Sicht wäre der „schwerwiegendste“ Fehler die Entscheidung für die blaue 
Verpackung, obwohl diese in der Realität nicht zu besseren Absatzzahlen führt. 


b. Ich lehne die Hypothese, dass der Absatz mit blauer Verpackung zurückgeht bzw. 
gleich bleibt nicht ab, obwohl ın Wahrheit die blaue Verpackung zu besseren Absatz- 
zahlen führt: P(Entscheidung für Ay|A, richtig) = B-Fehler. 

c. Bei unbekannter Varianz der Grundgesamtheit und nicht benötigtem Korrekturterm 
ergibt sich bei einer Stichprobengröße von 100 (> 30) folgender Annahmebereich für 
Ho: 


m 360 
[-00; uo + Z1-00x] = [oo Ko-+ | = E 10.000 + m 
„99 


— [--00: 10.084,17] 
(6.72) 


Ho wird beibehalten, da der empirische Mittelwert x = 10.050 in diesen Annahmebereich 
fällt. Die Annahme der Geschäftsleitung, dass die blaue Verpackung nicht zu niedrigeren 
Absatzmengen führt, kann auf dem 1 %-Niveau nicht bestätigt werden. 


d. Approximativ kann bei der Berechnung des Konfidenzintervalls die Normalverteilung 
angenommen werden, wenn die errechnete Stichprobengröße den Wert 30 überschrei- 
tet. Die Untergrenze des einseitigen Konfidenzintervalls bei unbekannter Varianz der 
Grundgesamtheit und (n — 1) > 30 sowie n/N > 0,05 berechnen sich durch 





= A — Semp 
Kerze ur x 2 (6.73) 


vn-] 


Werden die Werte in diese Gleichung eingesetzt, ergibt sich: 


360 — 100 360 2 
9950 = 10.050 — 1,645 — — > Yn-1 =5,9 
nl — 1,645 Sn 


> n=56,06 837. (6.74) 











Durch Rundungen kann es zu leichten Abweichungen kommen. Da die Stichprobengröße 
weit über dem Wert 30 liegt, ıst die Verwendung der Normalverteilung zulässig. 


Lösung 42 


a. Es liegt eine gepaarte/abhängige Stichprobe vor. Aufgrund des ordinalen Skalenni- 
veaus kann der Wilcoxon-Vorzeichen-Rang-Test angewendet werden. Wenn approxi- 
mativ eine Normalverteilung der Mittelwerte der Stichproben unterstellt werden kann 
(dies istbein = 2-60 = 120 eine realistische Annahme), eignet sich zudem der 1-Test 
für gepaarte/abhängige Stichproben. 
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b. Es liegen zwei unabhängige Stichproben vor. Wenn approximativ die Normalvertei- 
lung und ein metrisches Skalenniveau unterstellt werden kann (dies ist bein = 2-60 = 
120 eine realistische Annahme), eignet sich der t-Test für unabhängige Stichproben. 
Ansonsten ist der Mann-Whitney-U-Test anzuwenden. 


Lösung 43 


a. Aufgrund fehlender Verteilungsangaben und der kleinen Stichprobe wurde ein Kruskal- 
Wallis-Test (H-Test) durchgeführt. Die asymptotische Sıgnifikanz ist deutlich kleiner 
als 0,05, sodass sich mindestens eine Werbeart von den anderen unterscheidet. Welche 
dieser drei Werbearten sich signifikant voneinander unterscheiden, darüber gibt der 
H-Test keine Auskunft. Niedrige durchschnittliche Messwerte bedeuten im gegebe- 
nen Beispiel eine hohe Kundenpräferenz (1 bedeutete ja, „würde ich sofort kaufen“). 
Den niedrigsten durchschnittlichen Rang hat die Werbeart „Lokalzeitung“. Ob sich 
diese aber signifikant von der Werbeart ‚Plakat‘ unterscheidet, muss durch einen 
Mann-Whitney-U-Test ermittelt werden. 

b. Zunächst wird die ordinal skalierte Variable der Größe nach sortiert und danach - ana- 
log zur Rangbildung bei Rangkorrelationskoeffizienten -— Rangplätze vergeben. Diese 
werden danach gruppenweise einer Durchschnittsbildung der Ränge unterzogen. 

c. Der Mann-Whitney-U-Test ist nicht signifikant. Die exakte Signifikanz beträgt 0,723, 
was weit über dem üblicherweise geforderten Grenzwert von 0,05 liegt. Die Produkt- 
qualität unterscheidet sich in der Kundenwahrnehmung zwischen Lokal- und Plakat- 
werbung nicht. Die einseitige asymptotische Signifikanz liegt mit 0,704/2 = 0,352 
im nicht-signifikanten Bereich. 


Lösung 44 

Untersucht wurde, ob sich die durchschnittlichen Jahresumsätze zweier Haushaltstypen 
signifikant voneinander unterscheiden. Da die Stichproben mit 178 und 184 hinreichend 
groß sind, wurde eine Normalverteilung angenommen und der 7-Test für unabhängige 
Stichproben verwendet. Die Standardabweichungen der beiden Stichproben (Stypı = 
15,88 Geldeinheiten; S7ypa = 29,91 Geldeinheiten) unterscheiden sich signifikant von- 
einander (Levene’s Test for Equality of Variances (F = 81,23; p = 0,000)), sodass 
die Signifikanz des Mittelwertunterschieds in der Zeile „Equal variances not assumed“ 
abgelesen wird: Man ırrt sich in p = 2,8 % der Fälle, wenn von unterschiedlichen Durch- 
schnittswerten ausgegangen wird. Haushaltstyp 2 generiert mit rund 778 Geldeinheiten 
einen signifikant höheren durchschnittlichen Jahresumsatz als Haushaltstyp 1 mit rund 
773 Geldeinheiten. 


Lösung 45 


a. Vgl. Abb. 6.58. 
b. 5/160 = 3,125 % 
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Abb. 6.59 Lösung Kfz-Marken (2) 
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30/85 = 35,29 
d. 1. 
2. 


Aufstellung der Hypothesen. 

Bestimmung der erwarteten Häufigkeiten unter Annahme der Gültigkeit der Null- 
hypothese. 

Überprüfung, ob höchstens 20 % der Zellen erwartete Häufigkeiten von weniger als 
fünf aufweisen. Falls das nicht der Fall ist, müssen Zeilen oder Spalten so aggregiert 
werden, dass dieser Zustand beseitigt ist. 

Bestimmung des Chi-Quadrat-Wertes (Teststatistik). 

Ablesen des kritischen Wertes zum angegebenen Signifikanzniveau aus der Tabelle. 
Entscheidung: Ist der empirische Chi-Quadrat-Wert größer als der kritische Wert, 
sind die beiden Variablen abhängig voneinander (wird die Nullhypothese abge- 
lehnt). Ist der empirische Chi-Quadrat-Wert kleiner als der kritische Wert, sind 
die beiden Variablen unabhängig voneinander (wird die Nullhypothese nicht ab- 
gelehnt). 


e. Da drei von acht (= 37,5% > 20%) Zellen der Kontingenztabelle erwartete Häufig- 
keiten von kleiner als fünf aufweisen, werden die beiden letzten Spalten der Tabelle 
aggregiert (vgl. Abb. 6.59). Es entsteht dann folgende Kontingenztabelle, bei der nur 
noch 16,6 Prozent der Zellen erwartete Häufigkeiten von weniger als fünf haben: 


Für die Bestimmung der Annahmekennzahl aus der Chi-Quadrat-Tabelle (vgl. Abschn. 8.2) 
ergibt sich: co = Y’[1 -a; (m - 1): (g-1)] = x[99 %: 2] = 9,21034. Ist x? > co wird 
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Ho (Unabhängigkeit) abgelehnt. Hier gilt: x” = 57,8431 > 9,21034 — Man irrt sich in 
weniger als einem Prozent der Fälle, wenn man davon ausgeht, dass ein Zusammenhang 
zwischen Kfz-Marke und Motorstärke besteht. 


f. Für die Bestimmung der Annahmekennzahl aus der Chi-Quadrat-Tabelle (vgl. Abschn. 
8.2) ergibt sich: co = „1 - a; (m - 1): (g-1)] = x’[99%; 3] = 11,3449. Ist 
x” > co wird Ho (Unabhängigkeit) abgelehnt. Hier gilt: x? = 7,128 < 11,3449 — 
Der Zusammenhang der beiden Variablen ist bei einer maximalen Irrtumswahrschein- 
lichkeit von höchstens 1 % statistisch nicht signifikant, sodass die 7/u-Hypothese nicht 
verworfen werden kann. 


Lösung 46 


» _ (130 - 89,25)” (30 — 26,25)” (130 — 85,5)? 


= — 84,41 (6.75) 
89.25 26,25 85,5 


b. Freiheitsgrade: (Zeilenzahl — 1) (Spaltenzahl — 1) = (2- 1)(3- 1) = 2; Bestimmung 
des kritischen Wertes aus der Chi-Quadrat-Tabelle (vgl. Abschn. 8.2): co = Y’[1 - 
a:(m -1):(g- 1] = x’[95 %;2] = 5,9915; Testentscheidung: Ist x? > co wird 
Ho(Unabhängigkeit) abgelehnt. Hier gilt: „’ = 84,41 > 5,9915 — Man irrt sich 
in höchstens 5 Prozent der Fälle, wenn man davon ausgeht, dass ein Zusammenhang 
zwischen der Höhe der Ausgaben und der Musikeinspielung besteht. 


Lösung 47 


a. In mehr als 20 % der Fälle entstehen Zellen mit einer erwarteten Häufigkeit kleiner als 
fünf. Deshalb werden die letzten drei Zeilen zu einer Zeile zusammengefasst (Lösung 
1). Für den Chi-Quadrat-Wert ergibt sich: Y — 0+4+0,44+0+1,45+0,16 = 6,06. 
Es bestünde auch die Möglichkeit, die letzten beiden Zeilen und die letzten beiden 
Spalten zu aggregieren (Lösung 2). Für den Chi-Quadrat-Wert ergibt sich dann: y? = 
000,002 F 0,0 EU 053-0 EU 0Z, 

b. Lösung 1: Freiheitsgrade: (Zeilenzahl — 1)(Spaltenzahl — 1) = 2? - 1))3-|1) = 2; 
Bestimmung des kritischen Wertes aus der Chi-Quadrat-Tabelle (vgl. Abschn. 8.2): 
co = „IA -e:(m-1):(-N] = 2795 %;2] = 5,9915; Testentscheidung: Ist 
x” > co wird Ho (Unabhängigkeit) abgelehnt. Hier gilt: x? = 6,06 > 5,9915 — 
Man irrt sich in weniger als fünf Prozent der Fälle, wenn man davon ausgeht, dass ein 
Zusammenhang zwischen Haushaltgröße und Anzahl der gekauften Bananen besteht. 
Ho (Unabhängigkeit) wird abgelehnt. 

Lösung 2: Freiheitsgrade: (Zeilenzahl — 1) - (Spaltenzahl — 1) = 3-1): 2? -1) =2; 
Bestimmung des kritischen Wertes aus der Chi-Quadrat-Tabelle (vgl. Abschn. 8.2): 
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co = YA -e;(m-1):(g- 1] = „7[95%;2] = 5,9915; Testentscheidung: Ist 
x° > co wird Ho (Unabhängigkeit) abgelehnt. Hier gilt: x? = 0,072 < 5,9915 — 
Man irrt sich in mehr als fünf Prozent der Fälle, wenn man davon ausgeht, dass ein 
Zusammenhang zwischen Haushaltgröße und Anzahl der gekauften Bananen besteht. 
Ho (Unabhängigkeit) wird beibehalten. Es zeigt sich: Je nach Aggregation können 
Ergebnisse resultieren, die zu unterschiedlichen Entscheidungen führen. 


Lösung 48 


a. Der gesuchte Anteil ist p = 12/80 = 15%. 

b. In diesem Fall geht es um zwei ordinalskalierte Variablen, die beide mehr als zwei Aus- 
prägungen aufweisen. Aus diesem Grund ist die Verwendung des Phi-Koeffizienten 
nicht sinnvoll. Es können lediglich die Koeffizienten Tau, Spearman und Cramers V 
heran gezogen werden. In keinem Fall sind die Ergebnisse signifikant (der Anteil der 
Zellen mit erwarteter Häufigkeit < 5 liegt unter 20 %). 

c. Nach dem durchgeführten Wilcoxon-Vorzeichen-Rang-Test ist der Unterschied signi- 
fikant (p = 0,000). Ansonsten hätte sich ein p-Wert von 0.001 ergeben. Man irrt sich 
somit in weniger als p < 0,5% der Fälle, wenn man davon ausgeht, dass sich die 
Einstellungen zum Preis vor und nach der Präsentation unterscheiden. Die Differen- 
zen zwischen den Werten nach und vor der Produktpräsentation sind ın 159 Fällen 
negativ und in nur sechs Fällen positiv. Das bedeutet, dass die Rangplätze nach der 
Präsentation sehr viel häufiger kleiner sind als vorher. Kleinere Werte bedeuten gemäß 
der angegebenen Skalierung, dass die Kunden nach der Produktpräsentation eher der 
Aussage zustimmen, dass es sich um einen fairen Preis handelt, als vorher. 

d. Nach dem durchgeführten 7-Test für gepaarte/abhängige Stichproben ist der Unter- 
schied ebenfalls signifikant (p = 0,000). Analog zu Aufgabenteil c. Kommt man zu 
dem Ergebnis, dass die Kunden den Preis nach der Präsentation für angemessener 
halten: Es ergibt sich eine Mittelwertdifferenz von (—0,3) zwischen der Bewertung 
nach (1,9) und vor (2,2) der Produktpräsentation. Während der (nicht-parametrische) 
Wilcoxon-Vorzeichen-Rang-Test als verteilungsfreier Test keinen bestimmten Ver- 
teilungstyp voraussetzt, ist beim (parametrischen) f-Test für gepaarte/abhängige 
Stichproben eine Normalverteilung der Mittelwerte vorausgesetzt. Kann die Vertei- 
lungsannahme der Normalverteilung nicht begründet angenommen werden, ist daher 
das nicht-parametrische Verfahren (Wilcoxon-Vorzeichen-Rang-Test) anzuwenden. 
Im Beispielfall kann aber aufgrund der hinreichend großen Stichprobe von n = 500 
eine Normalverteilung der Mittelwerte approximativ angenommen werden. 


Lösung 49 

Insgesamt wurde mit Hilfe eines Einstichproben-7-Tests überprüft, ob sıch der Alters- 
durchschnitt in einer Population von u = 54 Jahren unterscheidet. Dieses Verfahren setzt 
eine hinreichend große Stichprobe voraus, was mit n = 500 gegeben ist. Bei einer Stan- 
dardabweichung von 5 = 10,1 Jahren liegt der Mittelwert der Stichprobe bei x = 52,9 
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Jahren. Man irrt sich mit einer Wahrscheinlichkeit von p = 1,3 %, wenn man davon aus- 
geht, dass das Durchschnittsalter nicht dem Wert u = 54 Jahre entspricht. Geht man 
von einem Signifikanzniveau von «@ = 5% aus, so ist das Durchschnittsalter signifikant 
unterschiedlich von u = 54 Jahren. Das 95 %-Konfidenzintervall für das Alter entspricht: 


Hu/o = [54 — 2,01; 54 — 0,24] = [51,99; 53,76]. (6.76) 


Lösung 50 
Aus den Abb. 6.60 und Abb. 6.61 ergibt sich Folgendes: 


a. Varianzhomogenität kann nicht verworfen werden, da der Levene-Test insignifikant 
ist. Für alle Untergruppen ergibt der Kolmogorov-Smirnov-Test allerdings signifikante 
Ergebnisse. Die Annahmevoraussetzung der Normalverteilung ist entsprechend nicht 
gegeben. Zwar handelt es sich um eine sehr große Stichprobe, allerdings sollte an 
dieser Stelle in jedem Fall der nicht-parametrische Kruskal-Wallis-Test durchgeführt 
werden. 

b. Einfaktorielle ANOVA ergibt signifikante Unterschiede zwischen jedem einzelnen 
Fernsehsender. 

c. Einfaktorielle ANOVA ergibt signifikante Unterschiede zwischen jedem einzelnen 
Time-Slot. 

d. Ein Interaktionseffekt kommt dadurch zustande, dass die Zuschauer zu unterschiedli- 
chen Zeiten unterschiedliche Senderpräferenzen haben. 

e. Obwohl das ZDF kostengünstiger ist, erreicht es zu den angegebenen Zeiten weniger 
Zuschauer als die ARD. Das eigentliche Entscheidungsproblem „Ermittlung der Kos- 
ten pro Zuschauer“ kann mit gegebenem Datenmaterial nicht gelöst werden. 


Lösung 51 
Aus den Abb. 6.62 und Abb. 6.63 ergibt sich Folgendes: 


a. Grün. Randmittel sind immer größer als die der anderen Farben und entsprechende 
Variable ist signifikant. 

b. Einfaktorielle ANOVA ergibt signifikante Unterschiede. Scheffe ergibt Unterschiede 
für UK (niedrigste Besucherzahl); Spanien (Mittlere Besucherzahl); Deutschland und 
Frankreich (beide höchste Besucherzahl). 

c. Zwar kommt grün ı1.d.R. am besten an, dennoch wirken die einzelnen Farben in den 
Ländern unterschiedlich. Es gibt in der mehrfaktoriellen ANOVA also ein Zusammen- 
spiel zwischen den Faktoren Land (für sıch signifikant) und Farbe (für sich signifi- 
kant). 

d. Varianzhomogenität kann nicht verworfen werden, da der Levene-Test insignifikant 
ist. Der Kolmogorov-Smirnov-Test ergibt signifikante Ergebnisse, sodass die Annah- 
mevoraussetzung der Normalverteilung nicht gehalten werden kann. Zwar sind die 
Stichproben sehr groß, allerdings kann eine Verzerrung der Ergebnisse nicht ausge- 
schlossen werden. Die Durchführung eines Kruskal-Wallis-Tests ist an dieser Stelle 
geboten. 
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Levene's Test of Equality of Error Variances? 


Dependent Variable: Kontakte mit Zielgruppe 





Tests the null hypothesis that the error variance of the dependent variable is equal 
across groups. 
a. Design: Intercept + werbung + time + werbung * time 


Tests of Between-Subjects Effects 
Dependent Variable: Kontakte mit Zielgruppe 


Squares 
|Corrected Model |  2713194.96| 11]  246654.088| 2799.053 | .000| 
Intercept | 11877229.844| 1] 11877229.844| 134783.866 | .000| 
Werbung | 1449354541] 3]  483118.180|  5482.468| .000 
Time | 745670711 2]  372835,356| 4230.969 | .000| 
|Werbung*time | _ 438971.020| 6] _ 73161.837| 830.247 | .000| 
Error | grosmal He Ba | 
Total | 18092301.000| 10 000 | 
Corrected Total |  2sooBss00l Wl || 


a. R Squared = .969 (Adjusted R Squared = .969) 





Multiple Comparisons 
Dependent Variable: Kontakte mit Zielgruppe 
Scheffe 


(I) Werbung |(J) Werbung Mean Std. Error | Sig. | 95% Confidence 
Difference Interval 
5 
Bound | Bound 


zDE | -morl 7912| .000| -13.26| 8.82] 
ARD RTL | 3055| 778] .000| 2877| 33.131 
SATUPrr_ |  97ar| 83] .000| 9499| 99.94 
ARD |  1noe|l 0.791] .000| 8.82] 13.267 
RTL | ass] 862] .000| 3958| 44.40 
[SATUPror_ | 10850)  .957| .000| 105.83] 111.18 
ARD | 0955| 778] .000| 33.131 -28.777 
ZDF | 19] 862] .000| -44.40| -39.58| 
[SATUPro _ | 6652) 946] .000| 6387| 69.17 
ARD |  ;zar| 8835| .000| -99.94| -94.09° 
SATI/Pro7 |ZDE |  -10850| 957 .000| -111.18| -105.83| 
RTL | 6657| 946] .00o| 69.171 -63.87 


Based on observed means. The error term is Mean Square(Error) = 88.121. 





*, The mean difference is significant at the .05 level. 


Abb. 6.60 Ergebnisse der Varianzanalyse (Beispiel Werbekontakte) Teil 1 
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Multiple Comparisons 


Dependent Variable: Kontakte mit Zielgruppe 
Scheffe 


(I) Time slot |(J) Time slot Mean SideErrons ss io 95% Confidence 
Difference Interval 
2 
Bound | Bound 


zoo ea | 22 0 Mel rel es 


1900105 | ws mal ol iso) nz 

Io zo | 007] 70 | ne] 1178 
01059 Troamanse | ae] zul oo] 40] 146 
oa Mzooazss | oa] 7291 | one] 0ns6 
001939 Trasse | soo] zul mo] s146] 5450 


Based on observed means. The error term is Mean Square(Error) = 88.121. 





*, The mean difference is significant at the .05 level. 


Estimated Marginal Means of Kontakte mit Zielgruppe 
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Abb. 6.61 Ergebnisse der Varianzanalyse (Beispiel Werbekontakte) Teil 2 
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Levene's Test of Equality of Error Variances? 
Dependent Variable: Erwartete Besucherzahl pro Stunde in einem Baumarkt 


Tests the null hypothesis that the error variance of the dependent variable is 
equal across groups. 
a. Design: Intercept + country + colour + country * colour 


Tests of Between-Subjects Effects 
Dependent Variable: Erwartete Besucherzahl pro Stunde in einem Baumarkt 


Source Type II Sum of df Mean Square E 
Squares 
Corrected Model | 268649464.547° 24422678.595| 2489.57 


Intercept 1705513916.768 1705513916.768 | 173853.769 | .000| 


countr 96365533.102 8 32121844.367 3274.382 
2 


colour | 632748574551 2| 31637428.728| 3225.002| .000 
[country * colour | 599671252911 6| _9994520.882| 1018.804| .000 
Error 1 96922707 | Hl Ha — | 
Total | 25001700 0 3 | 
Corrected Total | arsaıasal el DD 3 3 | 


a. R Squared = .965 (Adjusted R Squared = .965) 





Multiple Comparisons 
Dependent Variable: Erwartete Besucherzahl pro Stunde in einem Baumarkt 
Scheffe 


(I) Country (J) Country Mean StesEreen]| Beore 95% Confidence 
Difference Interval 
” 
Bound | Bound 


Germany [Spin | 31746] 8325| 0001 294.15! 340,77 
UK | grusel 9541] .000| 944.46| 997.89 
France Spin | maıs| 8838| .000| 269.41| 318.091 
UK |  9a7rse| 9991] .000| 919.90| 975.85 


Frane | 9216| 8838| .000| -318.91| 269.41 

UK | 6537| 101221 .000| 625.371 682.06 | 
me est ar auf rauen 
UK 


Iran me ae al ul anshansı 
Spain 


France | 9788| 9991| .000| -975.85| -919.90 





Abb. 6.62 Ergebnisse der Varianzanalyse (Beispiel Baumarkt) Teil 1 
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Multiple Comparisons 


Dependent Variable: Erwartete Besucherzahl pro Stunde in einem Baumarkt 
Scheffe 


(I) Colour (J) Colour Mean Stel 2Errer]| Besıe: 95% Confidence 
Difference Interval 
2 
Bound | Bound 


.000 273.08| 310.47 


ı Green | 5110| 7788| .000| -530.49|-492.31| 
Ra Fler I BZ Ze mer ar a 
j Green | 80817| 7.620] .000| -821.85| -784.49| 
n Yellow | 51140) 7788| .o00| 492.31] 530.49 
Ba Red | soır] 7.60] .oool 784.49] 821.85 


Based on observed means. The error term is Mean Square(Error) = 9810.049. 





*, The mean difference is significant at the .05 level. 


Estimated Marginal Means of Number of visitors 
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Abb. 6.63 Ergebnisse der Varianzanalyse (Beispiel Baumarkt) Teil 2 


Lösung 52 
Aus den Abb. 6.64 und Abb. 6.65 ergibt sich Folgendes: 


a. Es bestehen signifikante Unterschiede. Die besten Werte kommen beim Werbeträger 
Zınedine zustande. 

b. Es bestehen signifikante Unterschiede. Die besten Werte kommen bei Connecting- 
Chocolate zustande. 
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Levene's Test of Equality of Error Variances? 
Dependent Variable: Erwarteter Absatz von Schnutella 
F 
a Bam 
Tests the null hypothesis that the error variance of the dependent variable is 
equal across groups. 
a. Intercept + spieler + message + spieler * message 


Tests of Between-Subjects Effects 
Dependent Variable: Erwarteter Absatz von Schnutella 


Source Type III Sum of df Mean Square IE Sig. 
Squares 
Corrected Model 63380369. | 8] 7922546.2 766.1 | .000| 


2596566347.0 2596566347.0| _251089.3| .000| 
spieler 13369405.0 6684702.5 


spieler * message 
Error 

Total 
Corrected Total 


a. R Squared = .926 (Adjusted R Squared = .925) 


message 17676416.9 7598443.2 





Multiple Comparisons 
Dependent Variable: Erwarteter Absatz von Schnutella 
Scheffe 


(I) Spieler (J) Spieler Mean Std. Error 
Difference 
(1-J) 


Wahn 4580| 10871 


95% Confidence 
Interval 


Lower | Upper 
Bound | Bound 
-472.49 | -419.11 


Zinedine 445.80" 10.871 
239.28° 11.300 


Frigo 206.52° 11.330 178.70 | 234.34 
-239.28° 11.300 -267.03 | -211.54 


Based on observed means. The error term is Mean Square(Error) = 10341.206. 
*, The mean difference is significant at the .05 level. 


419.11 | 472.49 


211.54 | 267.03 





ige 1 20682] 1nsool oo] 208 
000 
000 


Abb. 6.64 Ergebnisse der Varianzanalyse (Beispiel Schnutella) Teil 1 


c. Varianzhomogenität kann nicht verworfen werden, da der Levene-Test insignifikant 
ist. Alle Faktoren haben einen signifikanten Einfluss. Die Entscheidung fällt auf den 
Werbeträger Zinedine, allerdings mit der Werbebotschaft Chocolat ohlala. Grund hier- 
für ıst der Interaktionseffekt. Aufgrund der Verletzung der Normalverteilungsannahme 
sollten die Ergebnisse mit Hilfe des Kruskal-Wallis-Tests überprüft werden. Was die 
Varianzanalyse nicht beantworten kann, sind Aussagen zu den marginalen Effekten, 
wie es beispielsweise bei der Regressionsanalyse möglich ist. 
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Multiple Comparisons 


Dependent Variable: Erwarteter Absatz von Schnutella 
Scheffe 


(I) Message (J) Message Mean Ste JErren| Besıe. 95% Confidence 
Difference Interval 
(I-J) Lower | Upper 
Bound | Bound 
Chocolat-Oh- 

-382.00” 11.376 -409.93 | -354.07 

Schokolade |la-la m nnaro| mo usa |-anaor 
+ Diszipli 

DEZE ne -429.65' 11.391 -457.61 | -401.68 
Chocolate 


Schokolade mit 
382.00° 11.376 4.07| 409. 
De 
— SONNE. _47.65° 10.795 7415| -21.15 
Chocolate 
nen 429,65° 11.391 401.68 | 457.61 
Connecting Disziplin 
Chöselat -Oh- 
ne . nn nu 47.65* 10.795 0 2115| 7415 


Based on observed means. The error term is Mean Square(Error) = 10341.206. 





*, The mean difference is significant at the .05 level. 


Estimated Marginal Means of Erwarteter Absatz von Schnutella 


Werbemessage 


—— Schokolade mit Disziplin 
- - - Chocolat-Oh-la-la 

—-- Connecting Chocolale 
3000,00 


2700.00 


2400.00 


Estimated Marginal Means 


2100.00 = 


1800.00 





Wahn Zinedine Frigo 


Werbeträger 


Abb. 6.65 Ergebnisse der Varianzanalyse (Beispiel Schnutella) Teil 2 
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Formelsammlung 7 


Lageparameter 
Mittelwert aus einer Urliste: 


7 ( 
x IX X ne X Ze X; 
(X + %2 +... 4%) ei 


Mittelwert aus einer gegebenen Häufigkeitstabelle: 


k k 

ze l 

ı=-) Ay N, = Kae 
v=l v=1l 


Mittelwert aus klassierten Daten: 


| 
| 
sil- 


k k 
3 a > fum,, (m, ist die Klassenmitte) 
v=] v1 


Median aus klassierten Daten: 


os , 5- Fi ( 0G _ “u 


— X%0,5 = X; 21 Es fa) i 2 
i 


Median aus Urliste bei ungerader Beobachtungsanzahl (n): 


X = (Hl) 
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Median aus Urliste bei gerader Beobachtungsanzahl (n): 


5 (Ka + %+9) 


Quantile aus Urlisten (Weighted Average Methode): 
Zunächst wird das Produkt (n + 1) - p bestimmt. Das Ergebnis setzt sich aus einem 


se 


ganzzahligen Bestandteil vor dem Komma und einem Dezimalbruch nach dem Komma 
zusammen (1,f). Das gesuchte Quantil liegt zwischen den beiden Beobachtungswerten 
Xc) und X +1), wenn (if) die Ordnungszahlen des geordneten Datensatzes darstellt. Der 
berechnete Nachkommaanteil dient zur Positionierung zwischen den beiden Werten mit 
Hilfe der Formel: 


ef +J ’Xch 


Quantil aus klassierten Daten: 


I 


pP (x) Ax 
Fi 


_E x 
H=Xır 


Streuungsparameter 
Empirische Varianz: 


I x 2 
3 —2 2 —2 
Var(X)emp = Scmp = z ) Ä (x; -X) = z ) Ä ex 
1= = 
Empirische Standardabweichung: 


Semp = Vy Var(X)emp —_ 


Induktive/Theoretische Varianz: 





ix u 
Var(X )iheor — Ft 2 6% u 2) 
| 


Induktive/Theoretische Standardabweichung: 


Stheor a) Var & bear — 
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Bivariate Zusammenhangsmaße 
Berechnung von Chi-Quadrat: 





2 
k m (mi n ) 
D_ J 
Keil, 
i=1 j=1 1] 
Phi: 
22 
PHI = ı/ — 
n 
Kontingenzkoeflizient: 
2 
c= | € [0; ı[ 
rn 
Cramers V: 
dr 1 
V=,|—nn -0-,|— € [0;1 
\ » - (min(k,m) - ı) Yemen. | 
Kovarianz: 


ir _ __ 1x _ 
cov(x;y) = Sry — 2 > .@ - x)(yi -y) = = 2. xy 
i=] | 


Korrelation nach Pearson: 


N zz De? ZN) — y) 
520 17° 9 -m)- (12,0 - 792) 








Korrelation nach Spearman (Grundforme]): 





Sy _ „Dr (Ra) - RR) - RO) 


(EL. Ra) - REP): (EIILIRON - RO))) 








Grundregeln der Kombinatorik 
Permutation von N verschiedenen Elementen (ohne Wiederholung) 


PN 
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Permutation von N Elementen bei k unterschiedlichen Gruppen (mit Wiederholung) 


k 
PN a it N 
m = ——————, mi In = 
nı!nz!-....n;! = 


Kombination ohne Wiederholung/Zurücklegen (ohne Berücksichtigung der Reihenfolge) 


n_IN\_ N! 
C -()- 


Kombination mit Wiederholung/Zurücklegen (ohne Berücksichtigung der Reihenfolge) 


EN — N+n-]|1 
nn n 


Variation ohne Wiederholung/Zurücklegen (mit Berücksichtigung der Reihenfolge) 


N_ N \ N! 
n -.()) A(N-n)! 


Variation mit Wiederholung/Zurücklegen (mit Berücksichtigung der Reihenfolge) 
v —_ N" 


Grundregeln der Wahrscheinlichkeitsrechnung 
Additionssatz bei sich ausschließenden Ereignissen 


"(Ya)- gr 
i=1 i=1 
Komplementäre Ereignisse 
ANnB={} P(ANB)=0 
Additionssatz zweier sich nicht ausschließender Ereignisse 
P(AUB) = P(A)+ P(B)-(AnNDB) 
Multiplikationssatz bei Unabhängiskeit 


P(AN B)= P(A): P(B) 
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Genereller Multiplikationssatz 
P(ANB) = P(AlB)- P(B) 
Satz der Totalen Wahrscheinlichkeit 
P(A) = P(A|B) - P(B) + P(A|C)- P(C) +... + P(AlZ)- P(Z) 


Theorem von Bayes 
P(AlB) = P(B|A). P(A)/P(B) 


Diskrete Verteilungen 
Binomialverteilung: 


k kl(n—k)! 
e Erwartungswert einer binomialverteilten Zufallsvariable 
E(X)=n-p 
e Varianz einer binomialverteilten Zufallsvariable 
Var(X)=n-p-(l-p) 
e Binomialverteilte Zufallsvariablen sind annähernd (approximativ).... 
— ...normalverteilt (N(n- p; Yn- p- (1 - p))), wennn- p-(1—- p) > 9 silt. 
— ...POISSON-verteilt (Po(n - p)), wennn- p< 10 undn > 1500- p silt. 


Hypergeometrische Verteilung: 


en 
H(N,M,n,x) = 
(2) 
n 
e Erwartungswert einer hypergeometrisch verteilten Zufallsvariable 


E(X)=n:-M/N 


e Varianz einer hypergeometrisch verteilten Zufallsvariable 


M M\N-—-n 
Var(X)=n— |1- — |: 
N N/ N-1 
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e Hypergeometrisch verteilte Zufallsvariablen sind annähernd (approximativ)... 
— ...normalverteilt, wenn 0,1 < M/N <0,9undn > 30 gilt. 
— ...POISSON-verteilt (Po(n* M/N)), wenn 0,1 > M/N oder 0,9 < M/N und 
n > 30 gilt. 


Poisson Verteilung: 
X 


A 
P(X) = Er 


e Erwartungswert einer Poisson-verteilten Zufallsvariable 
EX) =u=\ 
e Varianz einer Poisson-verteilten Zufallsvariable 
Var(X)=A 


e Poisson-verteilte Zufallsvariablen sind approximativ normalverteilt (N(u = u)0o = 
YA)), wenn u > 10 gilt. 


Stetige Verteilungen 
Gleichverteilung: 


naeh) 
— b-a 
I) : 


sonst 


e Erwartungswert einer gleichverteilten Zufallsvariable 


a+b 


E(X) = — 





e Varianz einer gleichverteilten Zufallsvariable 


b- 2 
ne 
[2 
Normalverteilung: 
hl) = ee 
X) =. 2-0 
“ oV2-.T 


e Erwartungswert einer normalverteilten Zufallsvariable 


E(X)=u 
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e Varianz einer normalverteilten Zufallsvariable 
Var(X) = 0° 


e Standardisierung (z-Iransformation) 


IA 


Xu - Xo - 
PRSK<K)= pP (IE z<=—#) 
o 
Reproduktivität zweier Normalverteilungen 


N (# +12 yo) + „) 


Konfidenzintervall für den Mittelwert 
Berechnung von Konfidenzintervallen für den Mittelwert vgl. Abb. 5.7 


Länge eines Konfidenzintervalles 


S theor S emp 
— . u. 





Stichprobengröße eines Konfidenzintervalls 


2 2 2 2 z 2 
2 2 De 2 et en 
Ep 


Konfidenzintervall für den Anteilswert 
Berechnung von Konfidenzintervallen für den Anteilswert vgl. Abb. 5.10 
Länge eines Konfidenzintervalles für den Anteilswert 


S theor A 5 emp 
 — . a 
1-7 


Yn | 


Stichprobengröße eines Konfidenzintervalls für den Anteilswert 








Beeren 05 = 2:4 


3 theor 2 \ Z1_g \ p \ (l . p) 
n n 
Konfidenzintervall für die Varianz 

Zweiseitig 


2 2 
pP <o?< a) — pP Fr <o?< Ze) 


3 = 2 
A1-2n-1 Xen-ı 


3 3 
X1-%n-1 Xen-ı 


=1-@ 
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Einseitig 


2 
P (® = 1) " Sees z je S emp < ) 


a ns 
—-1)- 52 ne. 
— 1-«0oder P 0? ML Disor _ 27 "emp -=1-a 
Xo:n-1 Xa:n-1 


Einstichproben T-Test 
Berechnung des Einstichproben T-Tests für den Mittelwert vgl. Abb. 6.6 


Überschreitungswahrscheinlichkeit p bei zweiseitigem Test 


x— Mo 
0% 











p=2: ( re ( < fkritisch = 


) 


Überschreitungswahrscheinlichkeit p bei einseitigem Test 


0% 


_ x— uU : 
Die =? (" beine —e) für Ai: u < Mo 





x 


u RM E 
Prechts = ( — pP (" en °)) für Ai: 4 > Wo 


Chi-Quadrat Test 
Berechnung von Chi-Quadrat: 


2 
k m (mi _ n‘;) 
2 _ I 
er 
el ) 
Entscheidung: 
Ho (Unabhängigkeit) wird abgelehnt, wenn: 5 > em 


Kruskal-Wallis-Test (H-Test) 
Hypothesen: 


Ho: E(Rı) =E(Ro) =... =E(Re); Hı:E(R;) # E(R;), für mindestens ein 
beliebigesi # j 


7 Formelsammlung 257 


Teststatistik: 
k mp \\2 k (BR. _ N+i\2 
ndli N-1 R;-E(R N-] R; — —— 
endlich — z > J = )) = z 5 a ) ne 
jel ni JAl 12:nj 
Entscheidung: 


Teststatistik ist y2 verteilt mit k — 1 Freiheitsgraden. Gilt 73 < H;, Annahme von A; 


® 


Check for 
updates 





Tabellenanhang 8 


8.1 Standardnormalverteilung 


Tabelliert sind für Abszissenwerte z 
zwischen 0,00 und 3,29 mit den 
zugehörigen Werten der 
Verteilungsfunktion ®(z)=P(Z<z). 

Für negative z-Werte gilt ®(-z)=1-®(z). 
Lesehilfe: ®(2,33)=0,9901. 
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0.0 
0.1 
0.2 
0.3 
0.4 
0.5 
0.6 
0.7 
0.8 
0.9 
1.0 
1.1 
152 
1.3 
1.4 
1.5 
1.6 
1.7 
1.8 
1.9 
2.0 
2,1 
2.2 
23 
2.4 
2.3 
2.6 
2.1 
2:8 
2.9 
3.0 
3.1 
3:2 


0.00 

0.5000 
0.5398 
0.5793 
0.6179 
0.6554 
0.6915 
0:7257 
0.7580 
0.7881 
0.8159 
0.8413 
0.8643 
0.8849 
0.9032 
0.3192 
0.9332 
0.9452 
0.9554 
0.9641 
0.9713 
0.9772 
0.9821 
0.9861 
0.9893 
0.9918 
0.9938 
0.9953 
0.9965 
0.9974 
0.9981 
0.9987 
0.9990 
0.9993 


0.01 

0.5040 
0.5438 
0.5832 
0.6217 
0.6591 
0.6950 
0.7291 
0.7611 
0.7910 
0.8186 
0.8438 
0.8665 
0.8869 
0.9049 
0.9207 
0.9345 
0.9463 
0.9564 
0.9649 
0.9719 
0.9778 
0.9826 
0.9864 
0.9896 
0.9920 
0.9940 
0.9955 
0.9966 
0.9975 
0.9982 
0.9987 
0:9991 
0.9993 


0.02 

0.5080 
0.5478 
0.5871 
0.6255 
0.6628 
0.6985 
0.7324 
0.7642 
0.7939 
0.8212 
0.8461 
0.8686 
0.8888 
0.9066 
0.9222 
0.9357 
0.9474 
0.9573 
0.9656 
0.9726 
0.9783 
0.9830 
0.9868 
0.9898 
0.9922 
0.9941 
0.9956 
0.9967 
0.9976 
0.9982 
0.9987 
0.9991 
0.9994 


0.03 

0.5120 
0.5517 
0.5910 
0.6293 
0.6664 
0.7019 
0.7357 
0.7673 
0.7967 
0.8238 
0.8485 
0.8708 
0.8907 
0.9082 
0.9236 
0.9370 
0.9484 
0.9582 
0.9664 
0.9732 
0.9788 
0.9834 
0.9871 
0.9901 
0.9925 
0.9943 
0.9957 
0.9968 
0.9977 
0.9983 
0.9988 
0.299] 
0.9994 


0.04 

0.5160 
0.3597 
0.5948 
0.6331 
0.6700 
0.7054 
0.7389 
0.7704 
0.1995 
0.8264 
0.8508 
0.8729 
0.8925 
0.9099 
0.9251 
0.9382 
0.9495 
0.9591 
0.9671 
0.9738 
0.9793 
0.9838 
0.9875 
0.9904 
0.9927 
0.9945 
0.9959 
0.9969 
0.9977 
0.9984 
0.9988 
0.9992 
0.9994 


0.05 

0.5199 
0.5596 
0.5987 
0.6368 
0.6736 
0.7088 
0.7422 
0.7734 
0.8023 
0.8289 
0.8531 
0.8749 
0.8944 
0.9115 
0.9265 
0.9394 
0.9505 
0.9599 
0.9678 
0.9744 
0.9798 
0.9842 
0.9878 
0.9906 
0.9929 
0.9946 
0.9960 
0.9970 
0.9978 
0.9984 
0.9989 
0.9992 
0.9994 


0.06 

0.5239 
0.5636 
0.6026 
0.6406 
0.6772 
0.7123 
0.7454 
0.7764 
0.8051 
0.8315 
0.8554 
0.8770 
0.8962 
0.9131 
0.9279 
0.9406 
0.9515 
0.9608 
0.9686 
0.9750 
0.9803 
0.9846 
0.9881 
0.9909 
0.9931 
0.9948 
0.9961 
0.9971 
0.9979 
0.9985 
0.9989 
0.9992 
0.9994 


0.07 

0.5279 
0.5675 
0.6064 
0.6443 
0.6808 
0.7157 
0.7486 
0.7794 
0.8078 
0.8340 
0.8577 
0.8790 
0.8980 
0.9147 
0.9292 
0.9418 
0.9525 
0.9616 
0.9693 
0.9756 
0.9808 
0.9850 
0.9884 
0.9911 
0.9932 
0.9949 
0.9962 
0.2912 
0.9979 
0.9985 
0.9989 
0.9992 
0.9995 


0.08 

0:3319 
0.5714 
0.6103 
0.6480 
0.6844 
0.7190 
07517 
0.7823 
0.8106 
0.8365 
0.8599 
0.8810 
0.8997 
0.9162 
0.9306 
0.9429 
0.9535 
0.9625 
0.9699 
0.9761 
0.9812 
0.9854 
0.9887 
0.9913 
0.9934 
0.9951 
0.9963 
0.9973 
0.9980 
0.9986 
0.9990 
0.9993 
0.9995 
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0.09 

0:3359 
0.5753 
0.6141 
0.6517 
0.6879 
0.7224 
0.7549 
0.7852 
0.8133 
0.8389 
0.8621 
0.8830 
0.9015 
0.9177 
0.9319 
0.9441 
0.9545 
0.9633 
0.9706 
0.9767 
0.9817 
0.9857 
0.9890 
0.9916 
0.9936 
0.9952 
0.9964 
0.9974 
0.9981 
0.9986 
0.9990 
0.9993 
0.9995 


8.2 Chi-Quadrat-Verteilung 


8.2 Chi-Quadrat-Verteilung 


n 


| 
O1 01XO0 | [2219| WI PR DIN | — 


oo A 2 WW N N DD N DD NND DD DH HA RR Ha aa am 
oO OO 0/0 X 29 N PR DW N + OO XO SION N PR WIND 


100 


p=(l-e) 


0.001 
0.000 
0.002 
0.024 
0.091 
0.210 
0.381 
0.598 
0.857 
1,1952 
1.479 
1.834 
2.214 
2.617 
3.041 
3.483 
3.942 
4.416 
4.905 
5.407 
3921 
6.447 
6.983 
1.329 
8.085 
8.649 
9222 
9.803 

10.391 

10.986 

11.588 

17.916 

31.738 

46.520 

61.918 


a 









0.005 
0.000 
0.010 
0.072 
0.207 
0.412 
0.676 
0.989 
1.344 
1.735 
2.156 
2.603 
3.074 
3.365 
4.075 
4.601 
5.142 
5.697 
6.265 
6.844 
1.434 
8.034 
8.643 
9.260 
9.886 

10.520 

11.160 

11.808 

12.461 

13.121 

13.787 

20.707 

35.334 

3172 

67.328 


0.025 
0.001 
0.051 
0.216 
0.484 
0.831 
1.237 
1.690 
2.180 
2.700 
3.247 
3.816 
4.404 
5.009 
5.629 
6.262 
6.908 
7.564 
| 
8.907 
9.391 

10.283 

10.982 

11.689 

12.401 

15.120 

13.844 

14.573 

15.308 

16.047 

16.791 

24.433 

40.482 

37.193 

14.222 


2 
X 1-0 


0.005 
0.000 
0.010 
0.072 
0.207 
0.412 
0.676 
0.989 
1.344 
1.735 
2.156 
2.603 
3.074 
3.565 
4.075 
4.601 
5.142 
5.697 
6.265 
6.844 
1.434 
8.034 
8.643 
9.260 
9.886 

10.520 

11.160 

11.808 

12.461 

13,121 

13.787 

20.707 

35.334 

51.172 

67.328 


Tabelliert sind für ausgewählte Wahrscheinlich- 
keiten p=(1-«) die zugehörigen Quantile bei 
alternativer Anzahlen von n Freiheitsgraden. 
Lesehilfe: X, ..1.20- X 904.20 "28-412 


0.1 
0.016 
0.211 
0.584 
1.064 
1.610 
2.204 
2.833 
3.490 
4.168 
4.865 
3.378 
6.304 
1.042 
71.790 
8.547 
9.312 

10.085 

10.865 

11.651 

12.443 

13.240 

14.041 

14.848 

15.659 

16.473 

17.292 

18.114 

18.939 

19.768 

20.599 

29.051 

46.459 

64.278 

82.358 


0.5 
0.455 
1.386 
2.366 
3.397 
4.351 
5.348 
6.346 
1.344 
8.343 
9.342 

10.341 

11.340 

12.340 

13.339 

14.339 

15.338 

16.338 

17.338 

18.338 

19,337 

20.337 

21,331 

22,331 

23.3931 

24.337 

25.336 

26.336 

27.336 

28.336 

29.336 

39333 

39.335 

19.334 

99.334 
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Chi-Quadrat-Verteilung (Fortsetzung) 


Tabelliert sind für ausgewählte Wahrscheinlich- 
keiten p=(1-«) die zugehörigen Quantile bei 
alternativer Anzahlen von n Freiheitsgraden. 
Lesehilfe: X, ..1:20- X 904.20 28-412 









0 Ki X 
n ‚p=(l-e) 
0.9 0.95 0.975 0.99 0.995 0.999 

l 2.706 3.841 5.024 6.635 1.879 10.828 
2 4.605 5.991 1.378 9.210 10.597 13.816 
3 6.251 7.815 9.348 11.345 12.838 16.266 
4 1.719 9.488 11.143 13.27 14.860 18.467 
5 9.236 11.070 12.833 15.086 16.750 20.515 
6 10.645 12.592 14.449 16.812 18.548 22.458 
7| 12.017 14.067 16.013 18.475 20.278 24.322 
8 13.362 15.507 17.535 20.090 21.955 26.124 
9 14.684 16.919 19.023 21.666 23.589 21.811 
10. 15.987 18.307 20.483 23.209 25.188 29.588 
11| 17.275 19.675 21.920 24.725 26:51 31.264 
12 18.549 21.026 23.337 26.217 28.300 32.909 
13 | 19.812 22.362 24.736 27.688 29.819 34.528 
14 21.064 23.685 26.119 29.141 31.319 36.123 
15|, 22,307 24.996 27.488 30.578 32.801 37.697 
16| 23.542 26.296 28.845 32.000 34.267 39.2932 
17, 24.769 27.387 30.191 33.409 35.718 40.790 
18 25.989 28.869 31.526 34.805 37.156 42.312 
19 | 27.204 30.144 32.832 36.191 38.582 43.820 
20. 28.412 31.410 34.170 37.566 39.997 45.315 
21 29.615 32.671 35.479 38.932 41.401 46.797 
22. 30.813 33.924 36.781 40.289 42.796 48.268 
23 | 32.007 33,172 38.076 41.638 44.181 49.728 
24 | 33.196 36.415 39.364 42.980 45.559 51.179 
25 | 34.382 31.092 40.646 44.314 46.928 52.620 
26 | 35.563 38.885 41.923 45.642 48.290 54.052 
27, 36.741 40.113 43.195 46.963 49.645 55.476 
28 37.916 41.337 44.461 48.278 50.993 56.892 
29 | 39.087 42.557 45.722 49.588 52.336 58.301 
30 40.256 43.773 46.979 50.892 53.672 59.703 
40. 51.805 55.758 59.342 63.691 66.766 73.402 
60. 74.397 79.082 83.298 88.379 91.952 99.607 
80 | 96.578 101.879 106.629 112.329 116,52] 124.839 
100 118.498 124.342 129.561 135.807 140.169 149.449 
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8.3 Student-:-Verteilung 


mm 
O0 | SI! N I) RI WI D | 


A| PP WDN DU NV N DVD N NN HR MA RAM aaa am 
oO OO \COJ|XO | SI N PD DI OO OO | SINN N PI WIND 


120 


Quantil für 1/_, 


0.8 

1.376 
1.061 
0.978 
0.941 
0.920 
0.906 
0.896 
0.889 
0.883 
0.879 
0.876 
0.873 
0.870 
0.868 
0.866 
0.865 
0.863 
0.862 
0.861 
0.860 
0.859 
0.858 
0.858 
0.857 
0.856 
0.856 
0.855 
0.855 
0.854 
0.854 
0.851 
0.848 
0.845 
0.842 


0.9 

3.078 
1.886 
1.638 
1.533 
1.476 
1.440 
1.415 
1397 
1.383 
1.572 
1.363 
1.356 
1.350 
1.345 
1.341 
1.352 
1.333 
1.330 
1.328 
1.525 
1,323 
1,521 
1.319 
1.318 
1.316 
1.315 
1.314 
1513 
1.311 
1.310 
1.303 
1.296 
1.289 
1,282 


Ro 


/ 


0.95 

6.314 
2.920 
2333 
2.132 
2.015 
1.943 
1.895 
1.860 
1.833 
1.812 
1.796 
1,782 
1.771 
1,761 
1.753 
1.746 
1.740 
1.734 
1,729 
1,725 
1.721 
1,712 
1.714 
1.711 
1.708 
1.706 
1.703 
1,201 
1.699 
1.697 
1.684 
1.671 
1.638 
1.645 


1%) 


Tabelliert sind für ausgewählte Wahr- 
scheinlichkeiten p=(1-«) die zugehörigen 
Quantile t,_,., bei alternativer Anzahl von n 
Freiheitsgraden. Für n230 kann die 
Normalverteilung approximiert werden. 
Lesehilfe: t}_,.1:30 = £9ou,,30 =1,310 


% 


0.975 
12.706 
4.303 
3,182 
2.776 
2571 
2.447 
2.369 
2.306 
2.262 
2,228 
2.201 
2,119 
2.160 
2.145 
2.131 
2.120 
2.110 
24101 
2.093 
2.086 
2.080 
2.074 
2.069 
2.064 
2.060 
2.056 
2.052 
2.048 
2.045 
2.042 
2.021 
2.000 
1.980 
1.960 


0:99 
31.821 
6.965 
4.541 
3.747 
3.363 
3.143 
2.998 
2.896 
2.821 
2.764 
2.718 
2.681 
2.650 
2.624 
2.602 
2.383 
2.364 
2.992 
2.339 
2.328 
2.518 
2.508 
2.500 
2.492 
2.485 
2.479 
2.473 
2.467 
2.462 
2.457 
2.423 
2.390 
2.358 
2.326 


0:995 
63.657 
29.925 
5.841 
4.604 
4.032 
3.707 
3.499 
3.355 
3.250 
3.169 
3.106 
3.055 
012 
2.977 
2.947 
2.921 
2.898 
2.878 
2.861 
2.845 
2.831 
2.319 
2.807 
291 
2.787 
2.119 
2.71 
2.763 
2.190 
2.790 
2.704 
2.660 
2.617 
2.3706 


0.999 

318.309 
2232) 
10.215 
7203 
3.893 
5.208 
4.7185 
4.501 
4.297 
4.144 
4.025 
3.930 
3.892 
3.787 
31 
3.686 
3.646 
3.610 
3.319 
3.992 
3.321 
3.505 
3.485 
3.467 
3.450 
3.435 
3.421 
3.408 
3.396 
3.385 
3.307 
292 
3.160 
3.090 


263 


0.9995 

636.619 
31.59 
12.924 
8.610 
6.869 
5.959 
5.408 
5.041 
4.781 
4.587 
4.437 
4.318 
4.221 
4.140 
4.073 
4.015 
3.965 
3.922 
3.883 
3.850 
3.819 
3.192 
3.768 
3.745 
3.725 
3.107 
3.690 
3.674 
3.039 
3.646 
3.551 
3.460 
> 
3.291 
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8.4 Kritische Werte für den Wilcoxon-Vorzeichen-Rang-Test 


Einseitiger Test (@ =) 5% 125% 1% 0.5 % 5% 2.53% |1% 0.5 % 

Zweiseitiger Test (@ =) 10% 5% 2% 1% 10% 5% 2% 1% 

n 1] — — — — n 26 110 98 84 75 
2 — — 27119 107 92 83 
3 — - 28 130 116 101 91 
4 _ — — — 29 140 126 110 100 
5 0 0 — — 30 151 137 120 109 
6 2 0 — — 31'163 147 130 118 
7 3 2 0 — 32.175 159 140 128 
8 5 3 1 0 33 | 187 170 151 138 
9 8 3 3 1 34 200 182 162 148 
10 10 8 5 3 35/213 195 173 159 
11 13 10 7 5 36 227 208 185 171 
12 17 13 9 1 371241 221 198 182 
13 21 17 12 9 38 256 235 211 194 
14 25 21 15 12 39 1271 249 224 207 
15 30 25 19 15 40 | 286 264 238 220 
16 35 29 2; 19 41 302 279 22 233 
17 41 34 27 23 42 319 294 266 247 
18 47 40 32 21 43 | 336 310 28 261 
19 53 46 37 32 44 | 353 321 296 276 
20 60 32 43 37 45 371 343 312 291 
21 67 58 49 42 46 389 361 328 307 
22 75 65 3) 48 47 407 378 345 322 
23 83 13 62 54 48 426 396 362 339 
24 91 81 69 61 49 | 446 415 379 355 


D 
an 


100 89 16 68 50 466 434 1,397 1,373 
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